Какво е коефициент на инфлация на вариацията?
Вариантният инфлационен коефициент на инфлация (VIF) е мярка за размера на мултиколинеарност в набор от множество променливи на регресия. Математически, VIF за променлива регресионен модел е равно на съотношението на общата дисперсия на модела към дисперсията на модел, който включва само тази единична независима променлива. Това съотношение се изчислява за всяка независима променлива. Високият VIF показва, че асоциираната независима променлива е силно колинеарна с другите променливи в модела.
Ключови заведения
- Коефициентът на инфлация на дисперсия (VIF) осигурява мярка за мултиколинеарност сред независимите променливи в модела на множествена регресия. Откриването на мултиколинеарност е важно, тъй като макар да не намалява обяснителната сила на модела, той намалява статистическата значимост на независимите променливи. Голям VIF на независима променлива показва силно коллинеарна връзка с другите променливи, които трябва да се вземат предвид или коригират в структурата на модела и избора на независими променливи.
Разбиране на фактор на инфлация на вариацията
Множествена регресия се използва, когато човек иска да тества ефекта на множество променливи върху определен резултат. Зависимата променлива е резултатът, върху който се въздейства от независимите променливи, които са входни данни в модела. Мултиколинеарност съществува, когато има линейна връзка или корелация между една или повече независими променливи или входове. Мултиколинеарността създава проблем при множествената регресия, тъй като всички входове влияят един на друг, те всъщност не са независими и е трудно да се провери доколко комбинацията от независими променливи влияе на зависимата променлива или резултата в регресионния модел, В статистически план, моделът на множествена регресия, при който има висока мултиколинеарност, ще затрудни оценката на връзката между всяка независима променлива и зависимата променлива. Малки промени в използваните данни или в структурата на моделното уравнение могат да доведат до големи и нередовни промени в изчислените коефициенти на независимите променливи.
За да се гарантира, че моделът е правилно зададен и функционира правилно, има тестове, които могат да се провеждат за мултиколинеарност. Коефициентът на инфлация на вариацията е един такъв инструмент за измерване. Използването на коефициенти на инфлация на дисперсия помага да се идентифицира тежестта на проблемите с мултиколинеарност, така че моделът да може да бъде коригиран. Коефициентът на инфлация на вариацията измерва колко поведението (дисперсията) на независима променлива се влияе или надува от нейното взаимодействие / корелация с другите независими променливи. Коефициентите на инфлация на вариациите позволяват бърза оценка на това колко променлива допринася за стандартната грешка в регресията. Когато съществуват значителни проблеми с мултиколинеарността, коефициентът на инфлация на дисперсията ще бъде много голям за включените променливи. След идентифицирането на тези променливи могат да бъдат използвани няколко подхода за елиминиране или комбиниране на колинеарни променливи, решавайки въпроса за мултиколинеарността.
Докато мултиколинеарността не намалява общата прогнозна сила на модела, той може да даде оценки на регресионните коефициенти, които не са статистически значими. В известен смисъл може да се мисли като вид двойно броене в модела. Когато две или повече независими променливи са тясно свързани или измерват почти едно и също нещо, тогава основният ефект, който те измерват, се отчита два пъти (или повече) в променливите и става трудно или невъзможно да се каже коя променлива наистина влияе на независима променлива. Това е проблем, защото целта на много иконометрични модели е да се тества точно този вид статистическа връзка между независимите променливи и зависимата променлива.
Например, ако икономист иска да провери дали има статистически значима връзка между равнището на безработица (като независима променлива) и инфлацията (като зависима променлива). Включването на допълнителни независими променливи, които са свързани с нивото на безработица, подобни нови първоначални претенции за безработица биха могли да внесат мултиколинеарност в модела. Общият модел може да покаже силна, статистически достатъчна обяснителна сила, но не може да установи дали ефектът се дължи най-вече на безработицата или на новите първоначални претенции за безработица. Това би открило VIF и би предложило евентуално изпускане на някоя от променливите от модела или намиране на начин за консолидирането им за улавяне на съвместния им ефект, в зависимост от това коя конкретна хипотеза изследователят се интересува от тестване.