Kurtoza (z gr. κυρτός, kyrtos, kurtos – wydęty) – jedna z miar kształtu rozkładu wartości cechy statystycznej. W praktyce definiuje się ją najczęściej w formie tzw. kurtozy nadwyżkowej (nazywanej ekscesem lub współczynnikiem ekscesu, ang. excess kurtosis)[1]:
gdzie:
- – czwarty moment centralny,
- – odchylenie standardowe.
Klasyczny współczynnik kurtozy definiowany jest jako standaryzowany moment centralny czwartego rzędu:
Kurtoza nadwyżkowa (inaczej współczynnik ekscesu lub po prostu eksces: ) jest jednak wygodniejsza, gdyż:
- kurtoza nadwyżkowa rozkładu normalnego wynosi 0,
- jeśli jest sumą niezależnych zmiennych losowych, każdej o rozkładzie identycznym z rozkładem zmiennej losowej zachodzi własność:
Wbrew stwierdzeniom obecnym w niektórych podręcznikach, kurtoza nie mierzy „spłaszczenia”, „wysmukłości” ani „spiczastości” rozkładu. Na kurtozę ma wpływ intensywność występowania wartości skrajnych, mierzy więc ona, co się dzieje w „ogonach” rozkładu, natomiast kształt „czubka” rozkładu jest praktycznie bez znaczenia[1][2].
Rozkłady prawdopodobieństwa można podzielić ze względu na wartość kurtozy na rozkłady:
- mezokurtyczne (KurtE = 0) – wartość kurtozy nadwyżkowej wynosi 0, intensywność wartości skrajnych jest podobna do intensywności wartości skrajnych rozkładu normalnego (dla którego kurtoza nadwyżkowa wynosi dokładnie 0),
- leptokurtyczne (KurtE > 0) – kurtoza nadwyżkowa jest dodatnia, intensywność wartości skrajnych jest większa niż dla rozkładu normalnego („ogony” rozkładu są „grubsze”),
- platykurtyczne (KurtE < 0) – kurtoza nadwyżkowa jest ujemna, intensywność wartości skrajnych jest mniejsza niż w przypadku rozkładu normalnego („ogony” rozkładu są „węższe”).
Kurtoza nadwyżkowa z próby wyraża się wzorem:
gdzie:
- – -ta wartość cechy,
- – wartość oczekiwana w populacji,
- – odchylenie standardowe w populacji,
- – liczebność próby.
Powyższa statystyka jest obciążonym estymatorem kurtozy nadwyżkowej z populacji, estymator nieobciążony wyraża się wzorem:
gdzie:
- – średnia z próby,
- – odchylenie standardowe z próby,
- – kolejne wartości cechy,
- – liczebność próby.
Dowód
Niech:
- – moment centralny n–tego rzędu,
- – moment zwykły n–tego rzędu,
- Dystrybuanta rozkładu normalnego oraz gęstość prawdopodobieństwa rozkładu normalnego to odpowiednio:
Wiadomo, że w rozkładzie normalnym:
Mamy:
- a)
- b)
Obliczamy momenty zwykłe:
Obliczone wartości:
podstawiamy do wzoru na czwarty moment centralny z punktu b):
Stąd kurtoza jest równa:
Peter H.P.H. WESTFALL Peter H.P.H., Kurtosis as Peakedness, 1905 – 2014. R.I.P., „The American statistician”, 68 (3), 2014, s. 191–195, DOI: 10.1080/00031305.2014.917055, ISSN 0003-1305, PMID: 25678714, PMCID: PMC4321753 [dostęp 2021-03-15].