Какво е анализ на вариацията (ANOVA)?
Анализ на дисперсията (ANOVA) е инструмент за анализ, използван в статистиката, който разделя наблюдаваната агрегирана променливост, открита вътре в набор от данни, на две части: систематични фактори и случайни фактори. Систематичните фактори имат статистическо влияние върху дадения набор от данни, докато случайните фактори не. Анализаторите използват ANOVA теста, за да определят влиянието, което независимите променливи оказват върху зависимата променлива в регресионно проучване.
Методите t- и z-тест, разработени през 20-ти век, се използват за статистически анализ до 1918 г., когато Роналд Фишър създава метода за анализ на дисперсия. ANOVA се нарича още анализ на дисперсията на Фишър и това е удължаване на t- и z-тестовете. Терминът става добре известен през 1925 г., след като се появява в книгата на Фишър „Статистически методи за научноизследователски работници“. Той беше използван в експерименталната психология и по-късно се разшири до по-сложни теми.
Формулата за ANOVA е:
F = MSEMST, където: F = ANOVA коефициентMST = Средна сума от квадрати поради обработкатаMSE = Средна сума от квадрати поради грешка
Какво разкрива анализът на вариацията?
Тестът ANOVA е началната стъпка в анализа на фактори, които влияят на даден набор от данни. След като тестът приключи, аналитикът извършва допълнително тестване на методическите фактори, които измеримо допринасят за несъответствието на набора от данни. Аналитикът използва резултатите от ANOVA теста при f-тест, за да генерира допълнителни данни, които се привеждат в съответствие с предложените регресионни модели.
Тестът ANOVA позволява сравнение на повече от две групи едновременно, за да се определи дали има връзка между тях. Резултатът от формулата ANOVA, F статистиката (наричана още F-съотношение), позволява да се направи анализ на множество групи данни, за да се определи променливостта между пробите и вътре в пробите.
Ако не съществува реална разлика между тестваните групи, която се нарича нулева хипотеза, резултатът от статистиката на ANOVA F-съотношението ще бъде близък до 1. Колебанията в нейното вземане на проби вероятно ще последват разпределението на Fisher F. Това всъщност е група функции на разпределение, с две характерни числа, наречени числителни степени на свобода и знаменател степени на свобода.
Ключови заведения
- Анализът на дисперсията или ANOVA е статистически метод, който разделя наблюдаваните данни за дисперсия в различни компоненти, които да се използват за допълнителни тестове. Еднопосочен ANOVA се използва за три или повече групи данни, за да се получи информация за връзката между зависимите и независими променливи. Ако няма истинска разлика между групите, F-съотношението на ANOVA трябва да е равно на 1.
Пример за начина на използване на ANOVA
Изследовател може например да тества студенти от няколко колежи, за да види дали студентите от един от колежите постоянно превъзхождат студенти от другите колежи. В бизнес приложение, изследовател на научноизследователска и развойна дейност може да тества два различни процеса на създаване на продукт, за да провери дали един процес е по-добър от другия по отношение на ефективността на разходите.
Видът на използвания ANOVA тест зависи от редица фактори. Прилага се, когато данните трябва да бъдат експериментални. Анализът на дисперсията се използва, ако няма достъп до статистически софтуер, което води до изчисляване на ANOVA на ръка. Той е лесен за използване и най-подходящ за малки проби. При много експериментални дизайни размерите на извадките трябва да са еднакви за различните комбинации от факторни нива.
ANOVA е полезен за тестване на три или повече променливи. Той е подобен на множество двупробни t-тестове. Това обаче води до по-малко грешки от тип I и е подходящо за редица проблеми. ANOVA групира различията, като сравнява средствата на всяка група и включва разпространението на дисперсията в различни източници. Използва се с субекти, тестови групи, между групи и в рамките на групи.
Еднопосочна ANOVA срещу двупосочна ANOVA
Има два типа ANOVA: еднопосочна (или еднопосочна) и двупосочна. Еднопосочен или двупосочен се отнася до броя на независимите променливи при вашия анализ на тест за дисперсия. Еднопосочната ANOVA оценява влиянието на единствения фактор върху променлива на единствения отговор. Той определя дали всички проби са еднакви. Еднопосочната ANOVA се използва за определяне дали има някакви статистически значими разлики между средствата на три или повече независими (несвързани) групи.
Двупосочна ANOVA е разширение на еднопосочната ANOVA. С еднопосочен начин имате една независима променлива, засягаща зависима променлива. С двупосочна ANOVA има две независими. Например, двупосочната ANOVA позволява на компанията да сравнява производителността на работниците въз основа на две независими променливи, като заплата и набор от умения. Той се използва за наблюдение на взаимодействието между двата фактора и тества ефекта на два фактора едновременно.
