![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/1/15/GaussianScatterPCA.png/640px-GaussianScatterPCA.png&w=640&q=50)
Analýza hlavných komponentov
From Wikipedia, the free encyclopedia
Analýza hlavných komponentov (skratka: AHK) alebo analýza základných komponentov (angl. principal component analysis, skratka: PCA) je matematická štatistická metóda, ktorá využíva ortogonálnu transformáciu na to, aby previedla prvky množiny pozorovaní, u ktorých je možné, že sú korelované, na prvky takej množiny hodnôt, ktoré sú lineárne nekorelované. Tieto sa potom označujú ako hlavné komponenty alebo základné komponenty (angl. principal components).
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/1/15/GaussianScatterPCA.png/640px-GaussianScatterPCA.png)
Matematicky je analýza hlavných komponentov takmer to isté ako singulárny rozklad (iné názvy: singulárny rozklad matice, rozklad na singulárne hodnoty, dekompozícia singulárnej hodnoty; angl. singular value decomposition, skratka: SVD)[1].
Pri analýze hlavných komponentov ide teda o to, že hľadáme takú množinu lineárnych kombinácií pôvodných premenných (pozorovaní), ktorá zachováva čo najväčšie množstvo informácií o pôvodných premenných (pozorovaniach) a zároveň jej dimenzia bude menšia alebo nanajvýš rovná ako dimenzia pôvodnej množiny (počet prvkov novej množiny bude menší alebo nanajvýš rovný ako počet prvkov pôvodnej množiny). Týmto postupom sa docieli to, že bude možné študovať daný štatistický problém v podpriestore s menšou dimenziou, čo má veľký význam pri ďalšej analýze štatistického súboru (testovanie hypotéz, hľadanie oblastí spoľahlivosti, grafické znázorňovanie pozorovaní, a pod.).
Počet hlavných komponentov je teda vždy menší alebo nanajvýš rovný pôvodnému počtu prvkov. Ortogonálna transformácia, ktorá sa pri tejto metóde používa, je definovaná tak, aby mal prvý hlavný komponent najväčšiu varianciu spomedzi všetkých možných lineárnych kombinácii vektora pozorovaní.
Metódu analýzy hlavných komponentov navrhol v roku 1901 anglický matematik Karl Pearson a v roku 1933 ju zovšeobecnil americký matematik Harold Hotelling.