Какви са степените на свободата?
Степен на свобода се отнася до максималния брой логически независими стойности, които са стойности, които имат свобода да варират в извадката от данни.
Ключови заведения
- Градусите на свободата се отнасят до максималния брой логически независими стойности, които са стойности, които имат свободата да варират в извадката от данни. Степените на свободата обикновено се обсъждат във връзка с различни форми на тестване на хипотези в статистиката, като Chi- Square.Прочисляването на степените на свободата е ключово, когато се опитвате да разберете важността на статистиката на Chi-Square и валидността на нулевата хипотеза.
Разбиране на степените на свободата
Най-лесният начин да разберете концептуално степените на свободата е чрез пример:
- Помислете за извадка от данни, състояща се от простота, пет положителни числа. Стойностите могат да бъдат произволни числа без позната връзка между тях. Теоретично тази извадка от данни би имала пет степени на свобода. Четири от числата в извадката са {3, 8, 5 и 4}, а средната стойност на цялата извадка от данни е 6. Това трябва да означава, че пето число трябва да е 10. Не може да бъде нищо друго. Той няма свободата да варира. Така че степените на свобода за тази извадка от данни са 4.
Формулата за Степен на свобода е равна на размера на извадката от данни минус една:
Df = N − 1 навсякъде: Df = степени на свободаN = размер на извадката
Степените на свободата обикновено се обсъждат във връзка с различни форми на тестване на хипотези в статистиката, като Chi-Square. От съществено значение е да се изчисли степента на свобода, когато се опитвате да разберете важността на статистиката на Chi-Square и валидността на нулевата хипотеза.
Chi-Square тестове
Има два различни вида тестове на Chi-Square: тестът за независимост, който задава въпрос на взаимоотношения, като например „Има ли връзка между пол и SAT оценките?“; и тестът за доброто прилягане, който пита нещо от рода на „Ако монета е хвърлена 100 пъти, дали ще изплува глави 50 пъти и опашки 50 пъти?“
За тези тестове се използват степени на свобода, за да се определи дали определена нулева хипотеза може да бъде отхвърлена въз основа на общия брой променливи и проби в рамките на експеримента. Например, когато разглеждаме студентите и избора на курса, размерът на извадката от 30 или 40 студенти вероятно не е достатъчно голям, за да генерира значителни данни. Получаването на едни и същи или подобни резултати от изследване, използващо размер на извадка от 400 или 500 ученици, е по-валидно.
История на степените на свободата
Най-ранната и основна концепция на Градусите на свободата е забелязана в началото на 1800 г., преплетена в трудовете на математика и астроном Карл Фридрих Гаус. Съвременното използване и разбиране на термина бе изложено първо от Уилям Сиали Госет, английски статистик, в статията си „Вероятната грешка на средно ниво“, публикувана в Biometrika през 1908 г. под името на писалка, за да запази анонимността си.
В своите трудове Госсет не използва конкретно термина „Градуси на свободата“. Той обаче даде обяснение на концепцията през целия процес на разработване на това, което в крайна сметка би било известно като T-разпределение на Student. Действителният термин не става популярен чак през 1922 г. Английският биолог и статистик Роналд Фишър започва да използва термина "Градуси на свободата", когато започва да публикува доклади и данни за работата си, разработвайки чи-квадратчета.