Какво е Homoskedastic?
Хомоскедастичен (също изписано „хомоседастично“) се отнася до състояние, при което дисперсията на остатъчния или грешки термин в регресионен модел е постоянна. Тоест, терминът за грешка не варира много, тъй като стойността на променливата на прогнозата се променя. Въпреки това, липсата на хомоскедастичност може да предполага, че регресионният модел може да се наложи да включва допълнителни променливи променливи, за да се обясни ефективността на зависимата променлива.
Ключови заведения
- Хомоскедастичността възниква, когато дисперсията на термина за грешка в регресионен модел е постоянна. Ако дисперсията на термина за грешка е хомоскедастична, моделът беше добре дефиниран. Ако има твърде много вариации, моделът може да не бъде дефиниран добре. Добавянето на допълнителни променливи на прогноза може да помогне да се обясни производителността на зависимата променлива. Напротив, хетерокедастичността възниква, когато дисперсията на термина на грешка не е постоянна.
Как работи Homoskedastic
Хомоскедастичността е едно предположение за моделиране на линейна регресия. Ако дисперсията на грешките около регресионната линия варира много, регресионният модел може да бъде лошо дефиниран. Обратното на хомоскедастичността е хетерокедастичността, точно както обратното на „хомогенна“ е „хетерогенна“. Хетерокедастичност (също изписана „хетероседастичност“) се отнася до състояние, при което дисперсията на термина за грешка в уравнението на регресия не е постоянна.
Когато се има предвид, че дисперсията е измерената разлика между прогнозирания резултат и реалния изход на дадена ситуация, определянето на хомоскедастичност може да помогне да се определи кои фактори трябва да бъдат коригирани за точност.
Специални съображения
Един прост регресионен модел, или уравнение, се състои от четири термина. От лявата страна е зависимата променлива. Той представлява явлението, което моделът се стреми да „обясни“. От дясната страна са константа, променлива прогноза и остатъчен или грешка. Терминът за грешка показва размера на променливостта в зависимата променлива, която не се обяснява с променливата на прогноза.
Пример за хомоскедастик
Например, да предположим, че сте искали да обясните оценките на студентските тестове, като използвате времето, което всеки студент е прекарал да учи. В този случай резултатите от теста биха били зависимата променлива, а времето, прекарано в изучаване, ще бъде променливата на прогнозата.
Терминът за грешка ще покаже количеството отклонение в тестовите резултати, което не е обяснено с времето за проучване. Ако тази дисперсия е равномерна или хомоскедастична, това предполага, че моделът може да бъде адекватно обяснение за тестовата ефективност - обяснява я по отношение на времето, прекарано в изучаване.
Но вариацията може да е хетероскедастична. Графикът на данните за термина за грешка може да покаже, че голямо количество време за изследване съответства много тясно на високите резултати от теста, но това, че ниските резултати от тестовото време за изследване варират в широки граници и дори включват някои много високи резултати. Така че дисперсията на оценките не би била добре обяснена просто с една променлива прогноза - времето за изучаване. В този случай вероятно има някакъв друг фактор и моделът може да се наложи да се подобри, за да се идентифицира той или тях. По-нататъшното разследване може да разкрие, че някои студенти са виждали отговорите на теста преди време или че преди това са правили подобен тест, поради което не е необходимо да учат за този конкретен тест.
За да се подобри регресионния модел, изследователят следователно ще добави друга обяснителна променлива, указваща дали студент е виждал отговорите преди теста. След това регресионният модел би имал две обяснителни променливи - време за изучаване и дали студентът е знаел предварително отговорите. С тези две променливи ще се обясни повече от дисперсията на тестовите резултати и отклонението на термина за грешка може да бъде хомоскедастично, което предполага, че моделът е добре дефиниран.