Какво представлява разпределението на пробите?
Разпределение на извадка е вероятностно разпределение на статистиката, получена чрез голям брой проби, взети от конкретна популация. Разпределението на представителната извадка на дадена популация е разпределението на честотите от редица различни резултати, които евентуално биха могли да възникнат за статистически данни за популация.
Разбиране на разпределението на пробите
Много данни, получени и използвани от академици, статистици, изследователи, маркетолози, анализатори и т.н., всъщност са извадки, а не популации. Проба е подмножество от популация. Например медицински изследовател, който искаше да сравни средното тегло на всички бебета, родени в Северна Америка от 1995 до 2005 г., с тези, родени в Южна Америка за същия период от време, не може в рамките на разумен период от време да изготви данните за цялото население на над милион раждания, възникнали през десетгодишния период от време. Вместо това той ще използва само теглото на, да речем, 100 бебета, на всеки континент, за да направи заключение. Теглото на 200 използвани бебета е пробата, а средното тегло, изчислено, е средното за пробата.
Сега да предположим, че вместо да вземе само една проба от 100 тегла на новородено от всеки континент, медицинският изследовател взема повторни случайни проби от общата популация и изчислява средната проба за всяка група от проби. И така, за Северна Америка той събира данни за 100 тегла на новородени, записани в САЩ, Канада и Мексико, както следва: четири 100 проби от избрани болници в САЩ, пет 70 проби от Канада и три 150 записа от Мексико, общо от 1200 тежести на новородени, групирани в 12 комплекта. Той също така събира примерни данни за 100 тегла на раждане от всяка от 12-те страни в Южна Америка.
Всяка проба има собствена средна проба и разпределението на средството за извадка е известно като разпределение на извадката.
Изчисленото средно тегло за всеки набор от проби е разпределението на пробата на средната стойност. От извадка може да се изчисли не само средната стойност. Други статистически данни, като стандартното отклонение, дисперсия, пропорция и обхват, могат да бъдат изчислени от примерни данни. Стандартното отклонение и дисперсия измерват променливостта на разпределението на извадката.
Броят на наблюденията в популация, броят на наблюденията в дадена извадка и процедурата, използвана за изготвяне на извадкови набори, определят променливостта на разпределението на извадката. Стандартното отклонение на разпределението на извадката се нарича стандартна грешка. Докато средната стойност на разпределението на извадката е равна на средната стойност на популацията, стандартната грешка зависи от стандартното отклонение на популацията, размера на популацията и размера на извадката.
Знанието колко раздалечени са средните стойности на всеки от извадковите групи един от друг и от средната популация, ще покаже колко близо е средната стойност на извадката до средната популация. Стандартната грешка в разпределението на извадката намалява с увеличаване на размера на извадката.
Специални съображения
Популация или един набор от проби от числа ще имат нормално разпределение. Въпреки това, тъй като разпределението на извадката включва множество набори от наблюдения, не е задължително да има извита форма на камбана.
Следвайки нашия пример, средното популационно тегло на бебетата в Северна и Южна Америка има нормално разпределение, тъй като някои бебета ще са с поднормено тегло (под средното) или с наднормено тегло (над средното), като повечето бебета попадат между (около средната). Ако средното тегло на новородените в Северна Америка е седем килограма, средното тегло на извадката във всеки от 12-те набора пробни наблюдения, записани за Северна Америка, също ще бъде близо до седем килограма.
Ако обаче графирате всяко от средните стойности, изчислени във всяка от 1200 групите проби, получената форма може да доведе до равномерно разпределение, но е трудно да се предвиди със сигурност каква ще бъде действителната форма. Колкото повече проби използва изследователят от популацията от над милион тегловни стойности, толкова повече графиката ще започне да формира нормално разпределение.
- Разпределението на извадката е вероятностно разпределение на статистически данни, получени чрез голям брой проби, взети от конкретна популация. Разпределението на извадката на дадена популация е разпределението на честотите от диапазон от различни резултати, които евентуално биха могли да възникнат за статистика на Множество данни, изготвени и използвани от академици, статистици, изследователи, маркетолози и анализатори, всъщност са извадки, а не популации.
