一般化線形モデル (いっぱんかせんけいモデル、英: Generalized linear model、GLM)は、残差を任意の分布とした線形モデル。似たものとして一般線形モデルがあるが、これは残差が多変量正規分布に従うモデル。一般化線形モデルには線形回帰、ポアソン回帰、ロジスティック回帰などが含まれる。1972年にネルダーとウェダーバーンによって提唱された[1]。
|
この項目では、一般化線形モデル (generalized linear model)について説明しています。一般線形モデル (general linear model)については「一般線形モデル」をご覧ください。 |
確率変数 が指数型分布族である、つまり確率密度関数 は正準 (canonical) パラメーター , 分散 (dispersion) パラメーター とスカラー関数 , を用いて指数型
で表すことができるものとする。
一般化線形モデルでは、指数型分布族の正準パラメーター について、リンク関数 (link function) と呼ばれる滑らかな関数 と、別の確率変数 の実現値 とを用いて、 と表すことができるものとする。
一般化線型モデルは下記の3つの要素から構成される。
- 1. 指数型分布族の確率分布
- 2. 線形予測子 (linear predictor)
- 3. リンク関数 (link function) such that
下記のように尤度関数を定める。
このとき、下記等式が成立する。
この等式を用いて計算すると、確率変数 の平均は 、分散は であることが分かる。
下記の他、多くの確率分布が指数分布族に分類される。
- 正規分布
- ベルヌーイ分布
- ポアソン分布
- 二項分布
- ガウス分布
Nelder, John; Wedderburn, Robert (1972). “Generalized Linear Models”. Journal of the Royal Statistical Society. Series A (General) (Blackwell Publishing) 135 (3): 370–384. doi:10.2307/2344614. JSTOR 2344614.
- McCullagh, Peter; Nelder, John (1989). Generalized Linear Models, Second Edition. Boca Raton: Chapman and Hall/CRC. ISBN 0-412-31760-5
- Henrik Madsen and Poul Thyregod (2011). Introduction to General and Generalized Linear Models. Chapman & Hall/CRC. ISBN 978-1-4200-9155-7
- Julia でデータサイエンス 一般化線形モデルにおける各種診断プロットの描画法の Julia コード