Remove ads
From Wikipedia, the free encyclopedia
El terme quantil va ser usat per primera vegada per Kendall el 1940, en estadística descriptiva, com una mesura de posició no central que permet conèixer altres punts característics de la distribució que no són els valors centrals. El quantil d'ordre p d'una distribució (amb ) és el valor de la variable que marca un tall de manera que una proporció p de valors de la població és menor o igual que . Per exemple, el quantil d'ordre 0,36 deixaria un 36% de valors per sota i el quantil d'ordre 0,50 es correspon amb la mediana de la distribució.
Els quantils solen usar-se per grups que divideixen la distribució en parts iguals; enteses aquestes com a intervals que comprenen la mateixa proporció de valors. Els més usats són:
En el càlcul de quantils amb distribucions de variable contínua (per exemple, amb dades agrupades) pot aconseguir fàcilment que les parts en què es divideix la distribució siguin exactament iguals. No obstant això, en les distribucions de variable discreta (com el cas de dades aïllades) aquestes parts seran aproximadament iguals. No hi ha consens sobre la manera de realitzar aquesta aproximació, existint en la literatura científica nou mètodes diferents, que condueixen a resultats diferents. Per això, en calcular qualsevol quantil de dades no agrupades mitjançant de calculadora, programari o manualment, és bàsic el saber i indicar el mètode utilitzat.
La funció que a cada p li assigna el punt de tall , és a dir, el valor del quantil d'ordre p, s'anomena funció quantil.
Calcularem el quantil d'ordre 0.30 de l'edat de la població d'un poblet resumida a la taula:
Edat de la població | habitants | freqüència acumulada |
---|---|---|
0-20 | 9 | 9 |
20-40 | 18 | 27 |
40-60 | 26 | 53 |
60-80 | 7 | 60 |
80-100 | 4 | 64 |
El primer pas serà trobar l'interval en què es troba el quantil buscat: D'un total de 64 dades, el quantil 0,30 ocuparà la posició p = 64 × 0,3 = 19.2. Observem a la columna de freqüències acumulades que aquest valor, per estar comprès entre 9 i 27, correspon a l'interval 20-40.
Dins d'aquest interval, seleccionarem el valor del quantil per simple interpolació lineal. Per a això, seguint les indicacions del gràfic, només caldrà fer una regla de tres.
Els quartils són els tres valors que divideixen al conjunt de dades ordenats en quatre parts percentualment iguals. Apareixen citats en la literatura científica per primera vegada el 1879 per D. McAlister.[1]
La diferència entre el tercer quartil i el primer es coneix com a amplitud interquartílica. Es representa gràficament com l'amplada de les caixes en els anomenats diagrames de caixes.
Donada una sèrie de valors ordenats en forma creixent, es pot pensar que el seu càlcul podria efectuar-se:
Però això condueix a diferents mètodes de càlcul dels quartils primers (resp. tercer) segons que la mateixa mitjana s'inclogui o s'exclogui en la sèrie de la primera (resp. segona) meitat de valors.
No hi ha uniformitat del càlcul. En la bibliografia es troben fins a cinc mètodes que donen resultats diferents.[2] Un dels mètodes és el següent: donats n dades ordenats,
Es representen amb la lletra P. Per al percentil i-èsim, on la i pren valors de l'1 al 99. El i % de la mostra són valors menors que ell i el 100-i % restant són majors.
Apareixen citats en la literatura científica per primera vegada per Francis Galton en 1885[3]
Un mètode per calcular un percentil seria el següent: Es calcula on n és el nombre d'elements de la mostra ei el percentil. El resultat de realitzar aquesta operació en resulta un nombre real amb part entera E i part decimal D. Tenint en compte aquests 2 valors, s'aplica la següent funció:
El resultat d'aquesta última operació és el valor del percentil comanda.
Exemple a Youtube: http://www.youtube.com/watch?v=Ww0tPH_-31w
Hi ha diversos mètodes, que condueixen a resultats diferents, per estimar el valor dels quantils.[4] La bateria completa de nou mètodes està disponible en el llenguatge de programació R;[5] SAS inclou cinc dels mètodes esmentats; STAT, quatre. A diferència d'aquests, programari de propòsit general com Microsoft Excel inclou només un dels mètodes.
Citarem en aquest cas l'ús de Scilab, Matlab i Excel.
En Scilab, els percentils d'un conjunt de dades són calculats amb la instrucció "perctl". A aquesta instrucció cal introduir dos vectors. Un d'ells "x" ha de contenir les dades que volem processar i en l'altre "i", valors sencers compresos entre l'1 i el 100. La funció calcula quins són els valors de "x" que es corresponen amb els percentils indicats en "i". Per exemple:
i = [15,25,60,80]
calcularia els percentils 15, 25, 60 i 80 del conjunt de dades del vector "x", mostrant a la sortida una matriu de dues columnes. En la primera d'elles apareixen els valors dels percentils comandes i en la segona apareix la posició que ocupen en el vector "x" aquests valors:
prctile (x, i)
ans =
3. 43.
4. 3.
7. mitjana dels elements 1 i 19.
10/5 mitjana dels elements 6 i 7
Seguint amb Scilab, els quartils de la mostra són calculats amb la instrucció "quart". Aquesta instrucció és més senzilla que l'anterior. Només cal introduir un vector o matriu de valors i retornarà un vector amb el valor dels quartils de les dades introduïdes. Scilab també permet calcular l'amplitud interquartílica que és la distància que hi ha entre un quartil i un altre. Es pot fer amb la instrucció "iqr". Usarem aquest vector "x" que en el cas anterior:
quart (x)
ans = 3.75 7. 5/8
iqr (x)
ans = 4.75
Per MSExcel es pot usar
= Quartil (RANG, 1)
= Quartil (RANG, 2)
= Quartil (RANG, 3)
on RANG són les dades dels quals volem extreure el quartil i el valor 1, 2 i 3 indiquen el primer, segon i tercer quartil.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.