對一維的隨機變數
的高斯分佈存在以下機率密度函數:
其中的
為
的標準差,
為
的期望值。
而當將高斯分佈推廣到
維時,根據定義,若
維的隨機向量
服從多變數的常態分佈,則存在一個對稱半正定的共變異數矩陣
以及期望值向量
滿足
的特徵函數。若
為非奇異的,則此分佈可以由以下的機率密度函數描述:

為共變異數矩陣的行列式。
而高斯混合模型為單一高斯概率密度函數的延伸,用多個高斯概率密度函數(常態分布曲線)精確地量化變量分布,是將變量分布分解為若干基於高斯概率密度函數(常態分布曲線)分布的統計子模型,每個子模型可視為此混合模型的隱變量。
舉一個不是那麼嚴謹的例子,若是我們手上有一個班級中所有學生某一次考試的各項科目分數分佈,並且每一科的分數都大致依照高斯分佈。則當我們要描述每個學生的總分分佈時,單高斯模型及多維的高斯模型不一定能很好的描述這個分佈,因為每一科的分布的情形都不盡相同,此時我們可以用高斯混合分佈更好的來描述這個問題。