Какво е интервал на увереност?
Интервал на доверие в статистиката се отнася до вероятността параметърът на популацията да попадне между две зададени стойности за определено съотношение от време. Интервалите на поверителност измерват степента на несигурност или сигурност при метод за вземане на проби. Интервалът на доверие може да поеме произволен брой вероятности, като най-честата е 95% или 99% ниво на доверие.
Интервалът на увереност и нивото на доверие са взаимно свързани, но не са абсолютно еднакви.
Разбиране на интервал на увереност
Статистиците използват доверителни интервали за измерване на несигурността. Например, изследовател избира различни проби на случаен принцип от една и съща популация и изчислява доверителен интервал за всяка проба. Получените набори от данни са различни; някои интервали включват истинския параметър на популацията, а други не.
Интервалът на поверителност е диапазон от стойности, който вероятно би съдържал неизвестен параметър от популацията. Нивото на увереност се отнася до процента на вероятността или сигурността, че интервалът на доверие ще съдържа истинския параметър на популацията, когато рисувате произволна извадка много пъти. Или, на простото мнение, "Ние сме 99% сигурни ( ниво на доверие), че повечето от тези набори от данни (интервали на доверие) съдържат истинския параметър на популацията."
Ключови заведения
- Интервалът на доверие изчислява вероятността параметърът на популацията да попадне между две зададени стойности. Интервалите на увереност измерват степента на несигурност или сигурност при метод на вземане на проби. Най-често интервалите на доверие отразяват нивата на доверие от 95% или 99%.
Изчисляване на интервал на увереност
Да предположим, че група изследователи изучават височините на баскетболистите в гимназията. Изследователите вземат произволна извадка от популацията и установяват средна височина от 74 инча. Средната стойност от 74 инча е точкова оценка на средната популация. Самата точкова оценка е с ограничена полза, тъй като не разкрива несигурността, свързана с оценката; нямате добър усет колко далеч може да е тази средно 74-инчова проба от средната стойност на населението. Това, което липсва, е степента на несигурност в тази единствена извадка.
Интервалите на поверителност предоставят повече информация от оценките на точките. Чрез установяване на 95% доверителен интервал, използвайки средното и стандартно отклонение на извадката и приемайки нормално разпределение, представено от кривата на звънеца, изследователите стигат до горна и долна граница, която съдържа истинската средна стойност 95% от времето. Да приемем, че интервалът е между 72 инча и 76 инча. Ако изследователите вземат 100 произволни проби от популацията на баскетболистите в средните училища като цяло, средната стойност трябва да падне между 72 и 76 инча в 95 от тези проби.
Ако изследователите искат още по-голяма увереност, те могат да разширят интервала до 99% увереност. Това неизменно създава по-широк диапазон, тъй като прави място за по-голям брой средства за извадка. Ако установят, че интервалът на доверие 99% е между 70 инча и 78 инча, те могат да очакват 99 от 100 проби, оценени да съдържат средна стойност между тези числа. Ниво на доверие от 90% означава, че бихме очаквали 90% от прогнозните интервали да включват параметъра на популацията. По същия начин 99% ниво на доверие означава, че 95% от интервалите ще включват параметъра.
Чести заблуди относно интервала на увереност
Най-голямото погрешно схващане относно интервалите на доверие е, че те представляват процента на данните от дадена извадка, който попада между горната и долната граница. Например, може погрешно да се интерпретира гореспоменатият 99% доверителен интервал от 70 до 78 инча, като показва, че 99% от данните в произволна извадка попадат между тези числа. Това е неправилно, въпреки че съществува отделен метод за статистически анализ, който да направи такова определяне. Това включва идентифициране на средното и стандартното отклонение на извадката и нанасяне на тези фигури на крива на звънеца.