統計學中潛在類別模型latent class model,LCM ),簡稱潛類模型,將一組觀察到的(通常是離散的)多變量變量與一組潛變量聯繫起來 。LCM是一種潛變量模型 。因為潛在變量是離散的,所以它被稱為潛類模型。類的特徵在於條件概率模式,其指示變量對特定值的可能性。

潛在類別分析latent class analysis, LCA ),簡稱潛類分析,是結構方程建模的子集,用於在多變量分類數據中查找子類型。這些子類型稱為「潛類」(latent class)。

假設有如下情況,研究人員可能會選擇使用LCA來理解數據:想像一下,在一系列患有X,Y和Z疾病的患者中測量了症狀,並且疾病X與症狀a, b和c的存在相關,疾病Y與症狀為b,c,d的存在相關,以及疾病Z與症狀為a,c和d的存在相關。

LCA將嘗試檢測潛在類別(疾病實體)的存在,從而創建與症狀關聯的模式。 與因子分析一樣,LCA也可用於根據條件的最大似然類別成員對其進行分類。 [1]

因為解決LCA的標準是實現潛在的類別,在這些潛在類別中,一種症狀與另一種症狀之間不再有任何關聯(因為該類是引起其關聯的疾病),以及患者所具有的一組疾病(或類別a) case是一個成員)導致症狀關聯,症狀將是「有條件獨立」,即,以類成員身份為條件,他們不再相關。 [1]

模型

在每一個潛類中,所觀察到的變量 統計獨立的。 這是一個重要方面。 通常觀察到的變量,在統計學上是相關的。 通過引入的潛在可變的、獨立的恢復在這個意義上,在類變數是獨立的(當地的獨立性的)。 然後,我們說,該協會之間所觀察到的變量是解釋的類的潛變量(McCutcheon,1987年)。

在一種形式中,潛在類模型被寫為

其中 是的數量潛類和 被所謂招聘 或無條件的概率,應該總和。 是的 邊際或有條件的概率。

對一個雙向潛在的類型,形式是

這種雙向模型與概率潛在語義分析和非負矩陣分解有關 。

相關的方法

有許多方法具有不同的名稱和用途,它們具有共同的關係。 與LCA一樣, 聚類分析用於發現數據中類似分類群的情況。 多元混合估計(MME)適用於連續數據,並假設這些數據來自分佈的混合:想像一組由男性和女性混合產生的高度。 如果對多變量混合物估計進行約束以使得在每個分佈內測量必須不相關,則將其稱為潛在輪廓分析 。 經過修改以處理離散數據,這種約束分析稱為LCA。 離散的潛在特質模型進一步限制了從單個維度的片段形成的類:基本上將成員分配給該維度上的類:一個例子是將案例分配給社會類的能力或價值維度。

作為一個實際的例子,變量可以是政治問卷的多項選擇項。 在這種情況下,數據包括一個N路列聯表,其中包含許多受訪者的項目答案。 在這個例子中,潛在變量是指政治觀點,而潛在類別是指政治團體。 給定組成員資格, 條件概率指定選擇某些答案的機會。

應用

LCA可用於許多領域,例如: 協同過濾[2] 行為遺傳學 [3]診斷測試評估頁面存檔備份,存於互聯網檔案館) 。 [4]

參考

外部連結

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.