典型相關

在統計學中，典型相關分析（英語：Canonical Correlation Analysis）是對互協方差矩陣的一種理解。如果我們有兩個隨機變量向量 X = (X₁, ..., X_n) 和 Y = (Y₁, ..., Y_m) 並且它們是相關的，那麼典型相關分析會找出 X_i 和 Y_j 的相互相關最大的線性組合。^[1]T·R·Knapp指出「幾乎所有常見的參數測試的意義可視為特殊情況的典型相關分析，這是研究兩組變量之間關係的一般步驟。」^[2] 這個方法在1936年由哈羅德·霍特林首次引入。^[3]

給定兩個隨機向量 $X=(x_{1},\dots ,x_{n})'$ 和 $Y=(y_{1},\dots ,y_{m})'$ ，我們可以定義互協方差矩陣 $\Sigma _{XY}=\operatorname {cov} (X,Y)$ 為 $n\times m$ 的矩陣，其中 $(i,j)$ 是協方差 $\operatorname {cov} (x_{i},y_{j})$ 。實際上，我們可以基於 $X$ 和 $Y$ 的採樣數據來估計協方差矩陣。(如從一對數據矩陣)。

典型相關分析求出向量 $a$ 和 $b$ 使得隨機變量 $a'X$ 和 $b'Y$ 的相關性 $\rho =\operatorname {corr} (a'X,b'Y)$ 最大。隨機變量 $U=a'X$ 和 $V=b'Y$ 是 第一對典型變量。然後尋求一個依然最大化相關但與第一對典型變量不相關的向量；這樣就得到了 第二對典型變量。這個步驟會進行 $\min\{m,n\}$ 次。

[1]

[2]

[3]

典型相關

計算

推導

解法

實現

假設檢定

實際運用

例子

與principal angles的連接

參見

參考文獻

外部連結

Wikiwand - on