Какво е квартил?
Квартилът е статистически термин, описващ разделянето на наблюденията на четири дефинирани интервала въз основа на стойностите на данните и как те се сравняват с целия набор от наблюдения.
Разбиране на квартилите
За да разберем квантила, важно е да разберем медианата като мярка за централна тенденция. Медианата в статистиката е средната стойност на набор от числа. Точката, в която точно половината от данните се намира под и над централната стойност.
И така, като се има предвид набор от 13 числа, медианата ще бъде седмото число. Шестте числа, предхождащи тази стойност, са най-ниските числа в данните, а шестте числа след медианата са най-високите числа в дадения набор от данни. Тъй като медианата не се влияе от екстремни стойности или отживелици в разпределението, понякога се предпочита пред средната стойност.
Медианата е стабилен оценител на местоположението, но не казва нищо за това как данните от двете страни на нейната стойност се разпространяват или разпространяват. Това е мястото, където стъпките на квартила. Квартилът измерва разпространението на стойности над и под средната стойност, като разпределя разпределението на четири групи.
Ключови заведения
- Квартилът измерва разпространението на стойности над и под средната стойност, като разпределя разпределението на четири групи. Квартилът разделя данните на три точки - долен квантил, медиан и горен кватил - за да образува четири групи от набора от данни. Използват се квартили за изчисляване на интерквартилния диапазон, който е мярка за променливост около медианата.
Как работят квартилите
Точно както медианата разделя данните на половина, така че 50% от измерването лежи под медианата и 50% лежи над нея, така и четирителят разгражда данните на четвъртинки, така че 25% от измерването са по-малко от долната четвъртина, 50 % са по-малко от средната стойност, а 75% са по-малко от горната четворка.
Квартил разделя данните на три точки - долен триъгълник, среден и горен кватил - за да образува четири групи от набора от данни. Долният квантил или първият квантил се обозначава като Q1 и е средното число, което попада между най-малката стойност на набора от данни и медианата. Вторият квантил, Q2, също е средният. Горната или третата четворка, обозначена като Q3, е централната точка, която се намира между средната и най-големия брой на разпределението.
Сега можем да начертаем четирите групи, формирани от четирите. Първата група стойности съдържа най-малкото число до Q1; втората група включва Q1 към медианата; третият набор е средната за Q3; четвъртата категория включва Q3 до най-високата точка от данни на целия набор.
Всеки трикол съдържа 25% от общите наблюдения. По принцип данните са подредени от най-малките до най-големите:
- Първа четвъртина: най-ниските 25% от числата Втора четвъртина: между 25, 1% и 50% (до средната) Трета четвъртина: 51% до 75% (над средната) Четвърта четвъртина: най-високите 25% от числата
Квартилен пример
Нека да работим с пример. Да предположим, разпределението на математическите оценки в клас от 19 ученици във възходящ ред е:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Първо маркирайте средната стойност Q2, която в този случай е десетата стойност: 75.
Q1 е централната точка между най-малкия резултат и средната стойност. В този случай Q1 попада между първия и петия резултат: 68.
Q3 е средната стойност между Q2 и най-високата оценка: 84.
Сега, когато имаме своите квартили, нека интерпретираме техния брой. Резултат от 68 (Q1) представлява първия кватил и е 25 -ти перцентил. 68 е средната стойност на долната половина на резултата, посочена в наличните данни, т.е. средната стойност на оценките от 59 до 75.
Q1 ни казва, че 25% от оценките са по-малко от 68 и 75% от класните резултати са по-големи. Q2 (средната) е 50 -ти перцентил и показва, че 50% от оценките са по-малко от 75, а 50% от оценките са над 75. И накрая, Q3, 75 -ти персентил, разкрива, че 25% от оценките са по-големи и 75% са по-малко от 84.
Специални съображения
Ако точката на данни за Q1 е по-далеч от средната, отколкото Q3 е от средната, тогава можем да кажем, че има по-голяма дисперсия между по-малките стойности на набора от данни, отколкото сред по-големите стойности. Същата логика се прилага, ако Q3 е по-далеч от Q2, отколкото Q1 е от средната.
Алтернативно, ако има четен брой данни точки, средната стойност ще бъде средната стойност на средните две числа. В нашия пример по-горе, ако имахме 20 ученици вместо 19, средната стойност на техните резултати ще бъде средната аритметика на десетото и единадесетото число.
Квартилите се използват за изчисляване на интерквартилния диапазон, който е мярка за променливост около медианата. Интерквартилният диапазон се изчислява просто като разликата между първото и третото тримесечие: Q3 - Q1. В действителност диапазонът на средната половина на данните показва колко са разпространени данните.
За големи масиви от данни Microsoft Excel има функция QUARTILE за изчисляване на квартили.