Формулата за нормално разпределение се основава на два прости параметъра - средно и стандартно отклонение - които количествено определят характеристиките на даден набор от данни. Докато средната стойност показва „централната“ или средната стойност на целия набор от данни, стандартното отклонение показва „разпространението“ или изменението на точките от данни около тази средна стойност.
Помислете за следните 2 набора от данни:
Набор от данни 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Набор от данни 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
За Dataset1 средно = 10 и стандартно отклонение (stddev) = 0
За Dataset2 средно = 10 и стандартно отклонение (stddev) = 2.83
Нека построим тези стойности за DataSet1:
Подобно на DataSet2:
Червената хоризонтална линия и в двете горни графи показва "средната" или средната стойност на всеки набор от данни (10 и в двата случая). Розовите стрелки във втората графика показват разпространението или изменението на стойностите на данните от средната стойност. Това е представено със стандартна стойност на отклонение от 2, 83 в случай на DataSet2. Тъй като DataSet1 има всички стойности еднакви (като 10 всяка) и няма вариации, стойността на stddev е нула и следователно не са приложими розови стрелки.
Стойността на stddev има няколко значими и полезни характеристики, които са изключително полезни при анализа на данните. За нормално разпределение стойностите на данните са симетрично разпределени от двете страни на средната стойност. За всеки нормално разпределен набор от данни, начертаване на графика със stddev на хоризонтална ос и не. на стойности на данни по вертикална ос, се получава следната графика.
Свойства на нормално разпределение
- Нормалната крива е симетрична по отношение на средната стойност; Средната е в средата и разделя площта на две половини; Общата площ под кривата е равна на 1 за средно = 0 и stdev = 1; Разпределението е напълно описано от средната му стойност и stddev
Както се вижда от горната графика, stddev представлява следното:
- 68, 3% от стойностите на данните са в рамките на 1 стандартно отклонение от средната стойност (-1 до +1) 95, 4% от стойностите на данните са в рамките на 2 стандартни отклонения от средната стойност (-2 до +2) 99, 7% от стойностите на данните са в рамките на 3 стандартни отклонения от средната стойност (-3 до +3)
Площта под кривата на камбана, когато се измерва, показва желаната вероятност за даден диапазон:
- по-малка от X: - например вероятност стойностите на данните да са по-малки от 70 по-големи от X - например вероятност стойностите на данните да са по-големи от 95 между X 1 и X 2 - например вероятност за стойности на данни между 65 и 85
където X е стойност на интерес (примери по-долу).
Начертаването и изчисляването на площта не винаги е удобно, тъй като различните набори от данни ще имат различни средни и stddev стойности. За да се улесни единния стандартен метод за лесно изчисляване и приложимост към проблемите в реалния свят, беше въведено стандартното преобразуване в Z-стойности, които са част от таблицата за нормално разпределение.
Z = (X - средно) / stddev, където X е произволната променлива.
По принцип това преобразуване принуждава средното и stddev да се стандартизират съответно до 0 и 1, което дава възможност за лесни изчисления да се използва стандартно определен набор от Z-стойности (от таблицата за нормално разпределение). Моментна снимка на стандартна z-стойност таблица, съдържаща стойности на вероятността, е както следва:
Z |
0.00 |
0.01 |
0.02 |
0.03 |
0.04 |
0.05 |
0.06 |
0.0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0.1 |
0.0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0.2 |
0.0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0.3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0.4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0.5 |
0, 19146 |
0, 19497 |
0, 19847 |
0, 20194 |
0, 20540 |
0, 20884 |
… |
0.6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0.7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
За да намерите вероятността, свързана със z-стойност от 0, 239865, първо я закръглете до 2 десетични знака (т.е. 0, 24). След това проверете за първите 2 значими цифри (0, 2) в редовете и за най-малко значимата цифра (останали 0, 04) в колоната. Това ще доведе до стойност от 0.09483.
Пълната нормална таблица на разпределение, с точност до 5 десетични знака за стойности на вероятността (включително тези за отрицателни стойности), можете да намерите тук.
Нека видим няколко примера от реалния живот. Височината на индивидите в голяма група следва нормален модел на разпространение. Да приемем, че имаме набор от 100 индивида, чиито височини са записани и средната стойност и stddev са изчислени съответно до 66 и 6 инча.
Ето няколко примерни въпроса, на които можете да отговорите лесно, като използвате таблицата z-стойност:
- Каква е вероятността човек в групата да е 70 инча или по-малко?
Въпросът е да намерите кумулативна стойност на P (X <= 70), т.е. в целия набор от данни 100, колко стойности ще бъдат между 0 и 70.
Нека първо преобразуваме X-стойност от 70 в еквивалентна Z-стойност.
Z = (X - средно) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0.67 (кръг до 2 десетични знака)
Сега трябва да намерим P (Z <= 0.67) = 0. 24857 (от z-таблицата по-горе)
т.е. има 24.857% вероятност даден индивид в групата да бъде по-малък или равен на 70 инча.
Но се дръжте - горното е непълно. Не забравяйте, че търсим вероятност за всички възможни височини до 70, т.е. от 0 до 70. Горното просто ви дава частта от средна до желаната стойност (т.е. 66 до 70). Трябва да включим другата половина - от 0 до 66 -, за да стигнем до правилния отговор.
Тъй като 0 до 66 представлява половината част (т.е. една средна крайна до средна точка), вероятността й е просто 0, 5.
Следователно правилната вероятност човек да е 70 инча или по-малък = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%
Графично (чрез изчисляване на площта) това са двете обобщени области, представляващи решението:
- Каква е вероятността човек да е 75 инча или по-висок?
т.е. Намерете комплементарен кумулативен P (X> = 75).
Z = (X - средно) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1.5) = 1- P (Z <= 1.5) = 1 - (0.5 + 0.43319) = 0.06681 = 6.681%
- Каква е вероятността човек да е между 52 инча и 67 инча?
Намерете P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2.33 <= Z <= 0.17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Тази нормална таблица на разпределение (и z-стойности) обикновено намира приложение за всякакви вероятностни изчисления на очакваните движения на цените на фондовия пазар за акции и индекси. Те се използват при търговия, базирана на обхвата, идентифициране на възходящ или низходящ тренд, нива на подкрепа или съпротива и други технически индикатори, базирани на нормални концепции за дистрибуция на средно и стандартно отклонение.
Сравнете инвестиционни сметки × Офертите, които се появяват в тази таблица, са от партньорства, от които Investopedia получава компенсация. Описание на името на доставчикаСвързани статии
Търговия с основно образование
Тестване на хипотези във финансите: концепция и примери
Управление на риска
Оптимизирайте портфолиото си с помощта на нормално разпределение
Технически анализ Основно образование
Линейната регресия на времето и цената
Управление на риска
Използването и границите на променливостта
Финансов анализ
Как да изчислим рисковата стойност (VaR) в Excel
Инструменти за фундаментален анализ