Узагальнена дисперсія

З Вікіпедії, вільної енциклопедії

У багатовимірній статистиці узага́льнена диспе́рсія (англ. generalized variance), на додачу до загальної дисперсії[de], є одним з ключових показників загального розсіювання багатовимірного набору даних (з змінними ). При порівнянні узагальнених дисперсій двох різних загальних сукупностей можливо, що одна сукупність має більшу узагальнену дисперсію, ніж інша, але все ж меншу загальну дисперсію.

Узагальнену дисперсію визначають через визначник коваріаційної матриці. Поняття узагальненої дисперсії запровадив Семюел Стенлі Уілкс[en].

Визначення

Для коваріаційної матриці загальної сукупності узагальнену дисперсію визначають як її визначник, тобто,[1]

.

І навпаки, ви́біркову узагальнену дисперсію визначають як . В цьому випадку подає ви́́біркову коваріаційну матрицю[de].

Геометрична інтерпретація

Ви́біркова узагальнена дисперсія має геометричну інтерпретацію. Розширення еліпса на понад два виміри називають гіпереліпсоїдом. p-вимірний гіпереліпсоїд з центром в та на основі для стандартизації відстані до центру містить підмножину спостережень вибірки. Еліпсоїд має осі, пропорційні квадратним кореням з власних значень ви́біркової коваріаційної матриці. Можливо показати, що об'єм цього еліпсоїда пропорційний .[1]

Примітки

Wikiwand - on

Seamless Wikipedia browsing. On steroids.