Съдържание
- Формулата за корелация
- Чести грешки с корелацията
- Намиране на корелация в Excel
Корелацията измерва линейната връзка на две променливи. Чрез измерване и свързване на дисперсията на всяка променлива, корелацията дава указание за силата на връзката. Или казано по друг начин, корелацията отговаря на въпроса: Колко променлива A (независимата променлива) обяснява променлива B (зависимата променлива)?
Ключови заведения
- Корелацията е статистическото линейно съответствие на разликата между две променливи. Във финансите корелацията се използва в няколко аспекта на анализ, включително изчислението или стандартното отклонение в портфолиото. Изчисляването на корелацията може да отнеме много време, но софтуер като Excel улеснява изчисляването.
Формулата за корелация
Корелацията съчетава няколко важни и свързани статистически понятия, а именно дисперсия и стандартно отклонение. Вариантът е дисперсията на променлива около средната стойност, а стандартното отклонение е квадратният корен на дисперсия.
Формулата е:
Тъй като корелацията иска да оцени линейната връзка на две променливи, това, което наистина е необходимо, е да се види какво количество ковариация имат тези две променливи и до каква степен тази ковариация се отразява от стандартните отклонения на всяка променлива поотделно.
Чести грешки с корелацията
Най-често срещаната грешка е да приемем, че корелация, приближаваща +/- 1, е статистически значима. Четенето, приближаващо се до +/- 1, определено увеличава шансовете за действителна статистическа значимост, но без допълнително тестване е невъзможно да се знае. Статистическото изпитване на корелация може да се усложни по редица причини; изобщо не е прям. Критично предположение за корелация е, че променливите са независими и че връзката между тях е линейна. На теория бихте изпробвали тези твърдения, за да определите дали е подходящо изчисление за корелация.
Не забравяйте, че корелацията между две променливи НЕ означава, че А е причинила В или обратно.
Втората най-често срещана грешка е да забравите да нормализирате данните в обща единица. Ако се изчислява корелация на две бета, тогава единиците вече са нормализирани: самата бета е единицата. Ако обаче искате да съпоставите акциите, важно е да ги нормализирате в процентна възвръщаемост и да не споделяте промени в цените. Това се случва твърде често, дори сред инвестиционни специалисти.
За корелация на цените на акциите по същество задавате два въпроса: Каква е възвръщаемостта за определен брой периоди и как тази възвръщаемост корелира с възвръщаемостта на друга ценна книга за същия период? Ето защо корелацията на цените на акциите е трудна: Две ценни книжа могат да имат висока корелация, ако възвръщаемостта се променя ежедневно в проценти през последните 52 седмици, но ниска корелация, ако възвръщаемостта е месечна промяна през последните 52 седмици. Кой е по-добър"? Наистина няма перфектен отговор и това зависи от целта на теста.
Намиране на корелация в Excel
Има няколко метода за изчисляване на корелацията в Excel. Най-простото е да получите два набора данни едно до друго и да използвате вградената формула на корелация:
Това е удобен начин да се изчисли корелация между само два набора от данни. Но какво ще стане, ако искате да създадете корелационна матрица в редица набори от данни? За да направите това, трябва да използвате приставката за анализ на данни на Excel. Плъгинът може да се намери в раздела Данни, под Анализ.
Изберете таблицата на възвръщаемостта. В този случай колоните ни са озаглавени, така че искаме да поставим отметка в квадратчето „Етикети в първия ред“, така че Excel знае да третира това като заглавия. След това можете да изберете да изведете на същия лист или на нов лист.
След като натиснете Enter, данните се правят автоматично. Можете да добавите текст и условно форматиране, за да изчистите резултата.
