Какво е отклонение за избор на проби?
Пристрастието за подбор на извадка е вид отклонение, причинено от избора на неслучайни данни за статистически анализ. Пристрастията съществуват поради недостатък в процеса на подбор на извадка, при който подмножество от данни систематично се изключва поради определен атрибут. Изключването на подмножеството може да повлияе на статистическата значимост на теста или да доведе до изкривени резултати.
Разбиране на пристрастия за избор на проби
Пристрастието към оцеляването е често срещан тип пристрастия за избор на извадка. Например, когато тествате обратно инвестиционна стратегия за голяма група акции, може да е удобно да търсите ценни книжа, които имат данни за целия период на извадка. Ако щяхме да тестваме стратегията спрямо данните за запасите на стойност 15 години, може би ще сме склонни да търсим акции, които имат пълна информация за целия 15-годишен период. Въпреки това премахването на акции, които спряха търговията или скоро напуснаха пазара, би довело до пристрастие в нашата извадка от данни. Тъй като ние включваме само акции, продължили 15-годишния период, крайните ни резултати ще бъдат недостатъчни, тъй като те се представиха достатъчно добре, за да оцелеят на пазара.
Индексите за ефективност на хедж фондовете са един пример за пристрастие за подбор на извадка, подлежащо на отклонение от оцеляване. Тъй като хедж фондовете, които не оцеляват, спират да отчитат своята ефективност на индексиращи индекси, в резултат на това индексите естествено са наклонени към фондовете и стратегиите, които остават, следователно „оцеляват“.
Анализаторите могат да се адаптират, за да отчитат тези пристрастия, но могат да въведат предубеждения в новините в процеса.