Какво е емпиричното правило?
Емпиричното правило, наричано още правило три сигма или правило 68-95-99.7, е статистическо правило, което гласи, че при нормално разпределение почти всички данни попадат в три стандартни отклонения (обозначени с σ) от средната стойност (обозначен с µ). Разбито, емпиричното правило показва, че 68% попада в рамките на първото стандартно отклонение (µ ± σ), 95% в рамките на първите две стандартни отклонения (µ ± 2σ) и 99, 7% в рамките на първите три стандартни отклонения (µ ± 3σ),
Емпирично правило
Разбиране на емпиричното правило
Емпиричното правило често се използва в статистиката за прогнозиране на крайните резултати. След изчисляване на стандартното отклонение и преди събиране на точни данни, това правило може да се използва като груба оценка на резултата от предстоящите данни. Тази вероятност може да се използва временно, тъй като събирането на подходящи данни може да отнеме време или дори невъзможно. Емпиричното правило се използва също като груб начин за тестване на "нормалността" на разпределението. Ако твърде много точки от данни попадат извън трите граници на стандартното отклонение, това предполага, че разпределението не е нормално.
Ключови заведения
- В емпиричното правило се посочва, че почти всички данни се намират в рамките на 3 стандартни отклонения от средната стойност за нормално разпределение. По това правило 68% от данните попадат в рамките на едно стандартно отклонение. Деветдесет и пет процента от данните се намират в рамките на две стандартни отклонения. три стандартни отклонения е 99, 7% от данните.
Примери на емпиричното правило
Да предположим, че популация от животни в зоопарк се знае, че е нормално разпространена. Всяко животно живее до 13, 1 години средно (средно), а стандартното отклонение на продължителността на живота е 1, 5 години. Ако някой иска да знае вероятността едно животно да живее по-дълго от 14, 6 години, той може да използва емпиричното правило. Знаейки, че средната стойност на разпределението е на 13, 1 години, за всяко стандартно отклонение се появяват следните възрастови диапазони:
- Едно стандартно отклонение (µ ± σ): (13, 1 - 1, 5) до (13, 1 + 1, 5) или 11, 6 до 14, 6 Две стандартни отклонения (µ ± 2σ): 13, 1 - (2 х 1, 5) до 13, 1 + (2 х 1, 5), или 10, 1 до 16, 1Три стандартни отклонения (µ ± 3σ): 13, 1 - (3 x 1, 5) до 13, 1 + (3 x 1, 5), или, 8, 6 до 17, 6
Лицето, което решава този проблем, трябва да изчисли общата вероятност животното да живее 14, 6 или повече години. Емпиричното правило показва, че 68% от разпределението се намира в рамките на едно стандартно отклонение, в случая от 11, 6 до 14, 6 години. Така останалите 32% от дистрибуцията се намират извън този диапазон. Половината лежи над 14, 6, а половината лежи под 11, 6. И така, вероятността животното да живее повече от 14, 6 е 16% (изчислено като 32%, разделено на две).
Като друг пример, приемете вместо това, че животно в зоопарка живее до 10-годишна възраст със стандартно отклонение от 1, 4 години. Да предположим, че зоокеерът се опитва да разбере вероятността животно да живее повече от 7, 2 години. Това разпределение изглежда по следния начин:
- Едно стандартно отклонение (µ ± σ): 8, 6 до 11, 4 години Две стандартни отклонения (µ ± 2σ): 7, 2 до 12, 8 години Три стандартни отклонения ((µ ± 3σ): 5, 8 до 14, 2 години
Емпиричното правило гласи, че 95% от разпределението се намира в две стандартни отклонения. Така 5% лежи извън две стандартни отклонения; половината над 12, 8 години и половината под 7, 2 години. По този начин вероятността да живеете повече от 7, 2 години е:
95% + (5% / 2) = 97, 5%