Какво е множествена линейна регресия - MLR?
Множествената линейна регресия (MLR), известна също като множествена регресия, е статистическа техника, която използва няколко обяснителни променливи, за да прогнозира резултата от променлива на отговора. Целта на множествената линейна регресия (MLR) е да се моделира линейната връзка между обяснителните (независими) променливи и променливата (зависима) на отговор.
По същество множествената регресия е удължаването на обикновената регресия с най-малки квадрати (OLS), която включва повече от една обяснителна променлива.
Формулата за множествена линейна регресия е
Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ, където i = n наблюдения: yi = зависима променливаxi = разширителни променливиβ0 = y-прихващане (константа термин) βp = коефициенти на наклон за всяка обяснителна променливаϵ = терминът на грешката на модела (известен също като остатъците)
Обясняване на множествена линейна регресия
Простата линейна регресия е функция, която позволява на анализатор или статистик да прави прогнози за една променлива въз основа на информацията, която е известна за друга променлива. Линейна регресия може да се използва само когато човек има две непрекъснати променливи - независима променлива и зависима променлива. Независимата променлива е параметърът, който се използва за изчисляване на зависимата променлива или резултата. Моделът на множествена регресия се простира до няколко обяснителни променливи.
Моделът на множествена регресия се основава на следните предположения:
- Съществува линейна връзка между зависимите променливи и независимите променливи. Независимите променливи не са твърде силно свързани помежду си. Моите наблюдения се избират независимо и на случаен принцип от популацията. Останалите трябва да бъдат обикновено разпределени със средна стойност от 0 и дисперсия σ.
Коефициентът на определяне (R-квадрат) е статистически показател, който се използва за измерване на размера на разликата в резултата, който може да се обясни с разликата в независимите променливи. R2 винаги се увеличава, тъй като към модела на MLR се добавят повече предиктори, въпреки че прогнозите може да не са свързани с променливата на резултата.
R2 сам по себе си не може да се използва за идентифициране на кои предиктори трябва да бъдат включени в даден модел и кои трябва да бъдат изключени. R2 може да бъде само между 0 и 1, където 0 показва, че резултатът не може да бъде предсказан от никоя от независимите променливи, а 1 показва, че резултатът може да бъде предвиден без грешка от независимите променливи.
Когато интерпретирате резултатите от множествена регресия, бета коефициентите са валидни, като държите всички останали променливи постоянни ("всички останали равни"). Резултатът от множествена регресия може да бъде показан хоризонтално като уравнение или вертикално под формата на таблица.
Пример с използване на множествена линейна регресия
Например, анализатор може да иска да знае как движението на пазара влияе върху цената на Exxon Mobil (XOM). В този случай неговото линейно уравнение ще има стойността на индекса S&P 500 като независима променлива или предсказател и цената на XOM като зависима променлива.
В действителност има множество фактори, които предсказват резултата от дадено събитие. Движението на цените на Exxon Mobil, например, зависи от повече от просто представянето на цялостния пазар. Други прогнози като цената на петрола, лихвените проценти и движението на цените на фючърсите на петрола могат да повлияят на цената на XOM и цените на акциите на други петролни компании. За да се разбере връзка, в която присъстват повече от две променливи, се използва множествена линейна регресия.
Множествена линейна регресия (MLR) се използва за определяне на математическа връзка между редица случайни променливи. С други думи, MLR изследва как множество независими променливи са свързани с една зависима променлива. След като всеки от независимите фактори е определен за прогнозиране на зависимата променлива, информацията за множеството променливи може да се използва за създаване на точна прогноза за нивото на ефекта, който те имат върху променливата на резултата. Моделът създава връзка под формата на права линия (линейна), която най-добре приближава всички отделни точки от данни.
Позовавайки се на уравнението MLR по-горе, в нашия пример:
- y i = зависима променлива: цена на XOMx i1 = лихвени процентиx i2 = цена на петролаx i3 = стойност на S&P 500 индексx i4 = цена на фючърсите на петролаB 0 = y-прихващане във времето нулаB 1 = коефициент на регресия, който измерва промяната на единица в зависимата променлива, когато x i1 се променя - промяната в цената на XOM при промяна на лихвените процентиB 2 = стойност на коефициента, измерваща единичната промяна в зависимата променлива, когато x i2 се променя - промяната в цената на XOM при промяна на цените на петрола
Оценките с най-малко квадратчета, B 0, B 1, B 2 … B p, обикновено се изчисляват от статистически софтуер. В регресионния модел могат да бъдат включени много променливи, при които всяка независима променлива е диференцирана с число - 1, 2, 3, 4… p. Моделът на множествена регресия позволява на анализатора да прогнозира резултат въз основа на информация, предоставена на множество обяснителни променливи.
Все пак моделът не винаги е напълно точен, тъй като всяка точка от данни може да се различава леко от резултата, предвиден от модела. Остатъчната стойност, E, която е разликата между действителния резултат и прогнозирания резултат, е включена в модела, за да се отчитат такива малки изменения.
Ако приемем, че управляваме нашия XOM модел за регресия на цените чрез софтуер за изчисляване на статистически данни, който връща тази продукция:
Анализатор би изтълкувал този резултат да означава, че ако другите променливи се поддържат постоянни, цената на XOM ще се увеличи със 7, 8%, ако цената на петрола на пазарите се увеличи с 1%. Моделът показва също, че цената на XOM ще намалее с 1, 5% след ръст на лихвите с 1%. R 2 показва, че 86, 5% от колебанията в цената на акциите на Exxon Mobil може да се обясни с промени в лихвения процент, цената на петрола, фючърсите на петрола и индекса S&P 500.
Ключови заведения
- Множествената линейна регресия (MLR), известна също като множествена регресия, е статистическа техника, която използва няколко обяснителни променливи, за да прогнозира резултата от променлива на отговора. Множествената регресия е разширение на линейна (OLS) регресия, която използва само една обяснителна променлива. MLR се използва широко при иконометрия и финансови изводи.
Разликата между линейна и множествена регресия
Линейна (OLS) регресия сравнява отговора на зависима променлива при промяна на някаква обяснителна променлива. Рядко обаче зависима променлива се обяснява само с една променлива. В този случай анализаторът използва множествена регресия, която се опитва да обясни зависима променлива, използвайки повече от една независима променлива. Множеството регресии могат да бъдат линейни и нелинейни.
Множеството регресии се основават на предположението, че съществува линейна връзка между зависимите и независимите променливи. Той също така не предполага голяма корелация между независимите променливи.