Какво е Overfitting?
Overfitting е моделираща грешка, която възниква, когато дадена функция е твърде плътно приляга към ограничен набор от данни. Преизпълняването на модела обикновено е под формата на създаване на твърде сложен модел за обяснение на идиосинкразиите в изследваните данни.
В действителност често изследваните данни имат известна степен на грешка или случаен шум в нея. По този начин опитът да се направи моделът да се съобрази твърде тясно с леко неточни данни може да зарази модела със значителни грешки и да намали неговата прогнозна сила.
Ключови заведения
- Overfitting е грешка при моделиране, която възниква, когато дадена функция е твърде плътно приспособена към ограничен набор от данни. Финансовите специалисти винаги трябва да са наясно с опасностите от препълване на модел въз основа на ограничени данни.
Разбиране на Overfitting
Например, често срещан проблем е използването на компютърни алгоритми за търсене на обширни бази данни с исторически пазарни данни, за да се намерят модели. Като се има предвид достатъчно проучване, често е възможно да се разработят сложни теореми, които изглежда предсказват неща като възвръщаемост на фондовия пазар с голяма точност.
Въпреки това, когато се прилагат за данни извън извадката, такива теореми вероятно могат да се окажат просто превишаване на модел на това, което в действителност са били само случайни събития. Във всички случаи е важно да се тества модел на данни, които са извън извадката, използвана за неговото разработване.
Финансовите специалисти винаги трябва да са наясно с опасностите от преоборудване на модел въз основа на ограничени данни.