Какво е грешка в извадката?
Грешка в извадката е статистическа грешка, която възниква, когато анализаторът не избере извадка, която представлява цялата съвкупност от данни и резултатите, открити в извадката, не представляват резултатите, които биха се получили от цялата популация. Вземането на проби е анализ, извършен чрез избиране на редица наблюдения от по-голяма популация и селекцията може да доведе както до грешки в извадката, така и до грешки, които не са взети проби.
Ключови заведения
- Грешка в извадката е статистическа грешка, която възниква, когато анализаторът не избере извадка, която представлява цялата съвкупност от данни. Резултатите, открити в извадката, не представляват резултатите, които биха получени от цялата популация. чрез рандомизиране на избора на извадка и / или увеличаване на броя на наблюденията.
Разбиране на грешки при вземане на проби
Грешка в извадката е отклонение в стойността на извадката спрямо истинската стойност на популацията поради факта, че извадката не е представителна за популацията или е пристрастена по някакъв начин. Дори рандомизирани проби ще имат известна грешка в извадката, тъй като това е само приблизително приближение на популацията, от която се черпи.
Грешките при вземане на проби могат да бъдат елиминирани, когато размерът на извадката се увеличи, а също и като се гарантира, че пробата адекватно представлява цялата популация. Да приемем например, че XYZ Company предоставя услуга, базирана на абонамент, която позволява на потребителите да плащат месечна такса за поточно видео и друго програмиране в мрежата.
Фирмата иска да изследва собствениците на жилища, които гледат поне 10 часа програмиране в интернет всяка седмица и плащат за съществуваща услуга за стрийминг на видео. XYZ иска да определи какъв процент от населението се интересува от абонаментна услуга на по-ниски цени. Ако XYZ не обмисли внимателно процеса на вземане на проби, може да възникнат няколко типа грешки в извадката.
Примери за проби от грешки
Грешка в спецификацията на населението означава, че XYZ не разбира специфичните видове потребители, които трябва да бъдат включени в извадката. Ако например XYZ създава популация от хора на възраст между 15 и 25 години, много от тези потребители не вземат решение за покупка за услуга за стрийминг на видео, защото не работят на пълен работен ден. От друга страна, ако XYZ състави извадка от работещи възрастни, които вземат решения за покупка, потребителите от тази група може да не гледат 10 часа видео програмиране всяка седмица.
Грешката при подбора също води до изкривяване на резултатите от извадка, а често срещан пример е анкета, която разчита само на малка част от хората, които веднага реагират. Ако XYZ положи усилия да проследи с потребителите, които първоначално не реагират, резултатите от проучването може да се променят. Освен това, ако XYZ изключи потребителите, които не реагират веднага, резултатите от извадката може да не отразяват предпочитанията на цялото население.
Фактор на грешки, които не са извадки
XYZ също иска да избегне грешки, които не са взети за проби, причинени от човешка грешка, като грешка, направена в процеса на проучване. Ако една група потребители гледа само пет часа видео програмиране седмично и е включена в проучването, това решение представлява грешка, която не е взета проба. Задаването на предубедени въпроси е друг вид грешка.