Какво е поетапна регресия?
Регресионният анализ е широко използван статистически подход, който се стреми да идентифицира връзките между променливите. Идеята е да се обединят подходящи данни за вземане на по-добре информирани решения и е често срещана практика в света на инвестициите. Постепенната регресия е поетапната итеративна конструкция на регресионен модел, който включва автоматичен подбор на независими променливи. Наличието на статистически софтуерни пакети прави възможна постепенна регресия, дори при модели със стотици променливи.
Видове стъпаловидна регресия
Основната цел на поетапната регресия е чрез поредица от тестове (F-тестове, t-тестове) да се намери набор от независими променливи, които влияят значително на зависимата променлива. Това се прави с компютрите чрез итерация, която е процесът на достигане до резултати или решения, като се преминават през многократни кръгове или цикли на анализ. Провеждането на тестове автоматично с помощта на статистически софтуерни пакети има предимството да спести време за индивида.
Ключови заведения
- Регресионният анализ е статистически подход, който се стреми да разбере и измери връзките между независими и зависими променливи. Постепенната регресия е метод, който изследва статистическата значимост на всяка независима променлива в рамките на модела. Подходът за подбор напред добавя променлива и след това тества за статистическа значимост. Методът за елиминиране назад започва с модел, натоварен с много променливи и след това премахва една променлива, за да се тества нейната важност спрямо общите резултати. Регресът в стъпка има много критици, тъй като е подход, който вписва данни в модел за постигане на желания резултат.
Постепенната регресия може да бъде постигната или чрез изпробване на една независима променлива наведнъж и включването й в регресионния модел, ако е статистически значима, или чрез включване на всички потенциални независими променливи в модела и елиминиране на тези, които не са статистически значими. Някои използват комбинация от двата метода и затова има три подхода за поетапна регресия:
- Изборът напред започва без променливи в модела, тества се всяка променлива, тъй като е добавена към модела, след което запазва тези, които се считат за най-статистически значими - повтаря процеса, докато резултатите са оптимални. Елиминирането на напред започва с набор от независими променливи, изтрийте една по една, след което тествайте, за да видите дали премахната променлива е статистически значима. Двунасочното елиминиране е комбинация от първите два метода, които тестват кои променливи трябва да бъдат включени или изключени.
Пример за поетапна регресия, използвайки метода за елиминиране назад, би бил опитът да се разбере потреблението на енергия във фабриката, използвайки променливи като време на работа на оборудването, възраст на оборудването, размер на персонала, температури навън и време на годината. Моделът включва всички променливи - след това всяка се отстранява, една по една, за да се определи коя е най-малко статистически значима. В крайна сметка моделът може да покаже, че времето на годината и температурите са най-значителни, което вероятно предполага, че пиковата консумация на енергия във фабриката е, когато използването на климатик е най-високо.
Ограничения на поетапната регресия
Регресионният анализ, както линеен, така и мултиварентен, днес се използва широко в инвестиционния свят. Идеята често е да се намерят модели, съществували в миналото, които също могат да се появят в бъдеще. Проста линейна регресия, например, може да разгледа съотношението цена / печалба и възвръщаемостта на акциите в продължение на много години, за да се определи дали акциите с ниско P / E съотношение (независима променлива) предлагат по-висока възвращаемост (зависима променлива). Проблемът с този подход е, че пазарните условия често се променят и отношенията, които са се държали в миналото, не е задължително да са верни в настоящето или бъдещето.
Междувременно стъпаловидният регресионен процес има много критици и дори има призиви да се спре използването на метода изобщо. Статистиците отбелязват няколко недостатъка на подхода, включително неправилни резултати, присъща пристрастност в самия процес и необходимостта от значителна изчислителна способност за разработване на сложни регресионни модели чрез итерация.