Какво е средно оползотвореното?
Уинсоризирана средна стойност е метод за усредняване, който първоначално замества най-малките и най-големите стойности с най-близките до тях наблюдения. Това се прави, за да се ограничи ефекта от необичайни екстремни стойности или отклонения върху изчислението. След заместване на стойностите, след това се използва средноаритметичната формула за изчисляване на средноаритметичната средна стойност.
Формулата за спечеленото средно значение е
Уинсоризирана средна стойност = Nxn… xn + 1 + xn + 2… xn, където: n = Броят на най-големите и най-малките точки за данни, които трябва да бъдат заменени от наблюдението
Уинсоризираните средства се изразяват по два начина. Средното ниво на победа "k n " се отнася до замяната на "k" най-малките и най-големи наблюдения, където "k" е цяло число. Средното ниво на печалба "X%" включва замяна на даден процент от стойности от двата края на данните.
Как да изчислим средното ниво
Средната победа се изчислява, като се заменят най-малките и най-големите точки от данни, след това се сумират всички точки от данни и се разделя сумата на общия брой точки от данни.
Какво ви казва Уинсоризираното средно?
Средно победителите са по-малко чувствителни към външните хора, защото могат да ги заменят с по-малко екстремни стойности. Тоест, тя е по-малко податлива на очертания спрямо средната. Ако обаче в дадена дистрибуция има мастни опашки, ефектът от премахването на най-високите и най-ниските стойности в разпределението ще има слабо влияние поради големия брой променливост на данните за разпределението.
Ключови заведения
- Метод на усредняване, който включва замяна на най-малките и най-големите стойности с най-близките до тях наблюдения. По-малко чувствителен към външните хора, защото може да ги замести с по-малко екстремни стойности. За разлика от подрязаната средна, която включва премахване на точки от данни, въпреки че резултатът от двете са склонни да са близки.
Пример за това как да използвате средно оразмерена стойност
Човек може да изчисли средното ниво на победи за следния набор от данни: 1, 5, 7, 8, 9, 10, 14. В този пример, приемаме, че средното ниво на победител е в първия ред, заместваме най-малките и най-големите стойности с техните най-близки наблюдения.
Наборът от данни сега се появява, както следва: 5, 5, 7, 8, 9, 10, 10. При вземане на средноаритметична стойност на новия набор се получава средно победа средно 7, 7, или (5 + 5 + 7 + 8 + 9 + 10 + 10) разделено на 7.
Или помислете за 20% спечелено средно ниво, което взема първите 10% и долните 10% и ги замества със следващата им най-близка стойност. Ще спечелим следния набор от данни: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Двете най-малките и най-големите точки от данни, или 10%, ще бъдат заменени със следващата им най-близка стойност. Така новият набор от данни е: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Победителите средната стойност е 33, 9, или общата стойност на данните (678), разделена на общия брой точки от данни (20).
Разликата между Winsorized средно и подрязано средно
Средно победата включва промяна на точките от данни, докато подрязаната средна включва премахване на точки от данни. Обичайно е средното ниво на победа и подрязването да е близо.
Ограничения при използването на средно оразмерена стойност
Един основен недостатък за спечелените средства е, че те въвеждат пристрастия в набора от данни. При условие, наборът от данни е в идеалния случай по-малко пристрастен след модификацията, отколкото ако остатъците са останали.
Научете повече за средното ниво
За свързана информация, за разликите между ключовите средни изчисления.