בתורת ההסתברות ובסטטיסטיקה , התפלגות דיריכלה (על שם Peter Gustav Lejeune Dirichlet ), מסומנת לעיתים קרובות
Dir
(
α
)
{\displaystyle \operatorname {Dir} ({\boldsymbol {\alpha }})}
, היא משפחה של התפלגויות רב-משתניות רציפות המוגדרות על ידי וקטור
α
{\displaystyle {\boldsymbol {\alpha }}}
של ממשיים חיוביים. זוהי הכללה רב-משתנית של התפלגות ביתא ,[1] ומכאן שמה החלופי - התפלגות בטא רב-משתנית (MBD) . [2] התפלגות דיריכלה משמשת בדרך כלל כהתפלגות פריורית בסטטיסטיקה בייסיאנית , ולמעשה, התפלגות דיריכלה היא ההתפלגות הצמודה של ההתפלגות הקטגוריאלית וההתפלגות המולטינומית .
עובדות מהירות מאפיינים, פרמטרים ...
התפלגות דיריכלה
פונקציית צפיפות ההסתברות
מאפיינים
פרמטרים
K
≥
2
{\displaystyle K\geq 2}
מספר הקטגוריות (מספר שלם )
α
=
(
α
1
,
…
,
α
K
)
{\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
הם פרמטרים של ריכוז, כאשר
α
i
>
0
{\displaystyle \alpha _{i}>0}
תומך
x
1
,
…
,
x
K
{\displaystyle x_{1},\ldots ,x_{K}}
כאשר
x
i
∈
[
0
,
1
]
{\displaystyle x_{i}\in [0,1]}
ו-
∑
i
=
1
K
x
i
=
1
{\displaystyle \sum _{i=1}^{K}x_{i}=1}
פונקציית צפיפות הסתברות (pdf)
1
B
(
α
)
∏
i
=
1
K
x
i
α
i
−
1
{\displaystyle {\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
כאשר
B
(
α
)
=
∏
i
=
1
K
Γ
(
α
i
)
Γ
(
α
0
)
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\alpha _{0}{\bigr )}}}}
ו-
α
0
=
∑
i
=
1
K
α
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}}
תוחלת
E
[
X
i
]
=
α
i
α
0
{\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\alpha _{0}}}}
E
[
ln
X
i
]
=
ψ
(
α
i
)
−
ψ
(
α
0
)
{\displaystyle \operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\alpha _{0})}
(כאשר
ψ
{\displaystyle \psi }
היא פונקציית דיגמא )
ערך שכיח
x
i
=
α
i
−
1
α
0
−
K
,
α
i
>
1.
{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\quad \alpha _{i}>1.}
שונות
Var
[
X
i
]
=
α
~
i
(
1
−
α
~
i
)
α
0
+
1
,
{\displaystyle \operatorname {Var} [X_{i}]={\frac {{\tilde {\alpha }}_{i}(1-{\tilde {\alpha }}_{i})}{\alpha _{0}+1}},}
Cov
[
X
i
,
X
j
]
=
δ
i
j
α
~
i
−
α
~
i
α
~
j
α
0
+
1
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {\delta _{ij}\,{\tilde {\alpha }}_{i}-{\tilde {\alpha }}_{i}{\tilde {\alpha }}_{j}}{\alpha _{0}+1}}}
כאשר
α
~
i
=
α
i
α
0
{\displaystyle {\tilde {\alpha }}_{i}={\frac {\alpha _{i}}{\alpha _{0}}}}
, ו-
δ
i
j
{\displaystyle \delta _{ij}}
היא הדלתא של קרונקר
אנטרופיה
H
(
X
)
=
log
B
(
α
)
{\displaystyle H(X)=\log \mathrm {B} ({\boldsymbol {\alpha }})}
+
(
α
0
−
K
)
ψ
(
α
0
)
−
{\displaystyle +(\alpha _{0}-K)\psi (\alpha _{0})-}
∑
j
=
1
K
(
α
j
−
1
)
ψ
(
α
j
)
{\displaystyle \sum _{j=1}^{K}(\alpha _{j}-1)\psi (\alpha _{j})}
כאשר
α
0
{\displaystyle \alpha _{0}}
מוגדר כמו בשונות, למעלה; ו-
ψ
{\displaystyle \psi }
היא פונקציית דיגמא
פונקציה יוצרת מומנטים (mgf)
α
i
=
E
[
X
i
]
(
E
[
X
j
]
(
1
−
E
[
X
j
]
)
V
[
X
j
]
−
1
)
{\displaystyle \alpha _{i}=E[X_{i}]\left({\frac {E[X_{j}](1-E[X_{j}])}{V[X_{j}]}}-1\right)}
כאשר
j
{\displaystyle j}
יכול להיות כל אינדקס כולל,
i
{\displaystyle i}
עצמו
סגירה
ההכללה האינסוף-ממדית של התפלגות דיריכלה היא תהליך דיריכלה .
פונקציית צפיפות הסתברות
הדגמה כיצד הלוג של פונקציית הצפיפות משתנה כאשר K = 3 ואנו משנים את הווקטור α מ- α = (0.3, 0.3, 0.3) עד (2.0, 2.0, 2.0), תוך שמירה על כך שכל הרכיבים של
α
{\displaystyle \alpha }
נשארים שווים זה לזה.
בערך זה נעשה שימוש בסימנים מוסכמים מתחום המתמטיקה. להבהרת הסימנים ראו סימון מתמטי .
להתפלגות דיריכלה מסדר
K
≥
2
{\displaystyle K\geq 2}
עם פרמטרים
0
<
α
1
,
.
.
.
α
K
{\displaystyle 0<\alpha _{1},...\alpha _{K}}
, יש פונקציית צפיפות , לפי למידת לבג במרחב האוקלידי
R
K
−
1
{\displaystyle \mathbb {R} ^{K-1}}
, המתוארת באמצעות:
f
(
x
1
,
…
,
x
K
;
α
1
,
…
,
α
K
)
=
1
B
(
α
)
∏
i
=
1
K
x
i
α
i
−
1
{\displaystyle f\left(x_{1},\ldots ,x_{K};\alpha _{1},\ldots ,\alpha _{K}\right)={\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
כאשר
{
x
k
}
k
=
1
k
=
K
{\displaystyle \{x_{k}\}_{k=1}^{k=K}}
שייכים לסימפלקס
K
−
1
{\displaystyle K-1}
תקני, או באופן שקול, לכל
i
∈
{
1
,
…
,
K
}
{\textstyle i\in \{1,\dots ,K\}}
,
∑
i
=
1
K
x
i
=
1
,
x
i
∈
[
0
,
1
]
{\textstyle \sum _{i=1}^{K}x_{i}=1{\mbox{, }}x_{i}\in \left[0,1\right]}
.
הקבוע המנרמל הוא פונקציית בטא רב-משתנית, שניתן לבטאו במונחים של פונקציית גמא :
B
(
α
)
=
∏
i
=
1
K
Γ
(
α
i
)
Γ
(
∑
i
=
1
K
α
i
)
,
α
=
(
α
1
,
…
,
α
K
)
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod \limits _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum \limits _{i=1}^{K}\alpha _{i}\right)}},\qquad {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
תומך
התומך של התפלגות דיריכלה היא קבוצת וקטורים
K
{\displaystyle K}
ממדיים
x
{\displaystyle {\boldsymbol {x}}}
שהערכים שלהם הם מספרים ממשיים בקטע [0,1] כך ש
‖
x
‖
1
=
Σ
i
x
i
=
1
{\displaystyle \|{\boldsymbol {x}}\|_{1}=\Sigma _{i}x_{i}=1}
, כלומר סכום הקואורדינטות שווה ל-1. למשל עבור
K
=
3
{\displaystyle K=3}
התומך הוא משולש שווה-צלעות המשוכן במרחב התלת-ממדי, שקודקודיו בנקודות (1,0,0), (0,1,0) ו (0,0,1), כלומר נמצאים על צירי הקואורדינטות במרחק 1 מהראשית.
מומנטים מסדר שני
יהי
X
=
(
X
1
,
…
,
X
K
)
∼
Dir
(
α
)
{\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} ({\boldsymbol {\alpha }})}
. ויהי
α
0
=
∑
i
=
1
K
α
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}}
.
אזי על פי[3]
E
[
X
i
]
=
α
i
α
0
,
{\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\alpha _{0}}},}
Var
[
X
i
]
=
α
i
(
α
0
−
α
i
)
α
0
2
(
α
0
+
1
)
.
{\displaystyle \operatorname {Var} [X_{i}]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}}.}
פרט לכך, אם
i
≠
j
{\displaystyle i\neq j}
אז
Cov
[
X
i
,
X
j
]
=
−
α
i
α
j
α
0
2
(
α
0
+
1
)
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}}
.
מטריצת הקוויראנס היא אם כך סימטרית והפיכה.
שכיח
השכיח של ההתפלגות הוא[4] הווקטור
(
x
1
,
…
,
x
k
)
{\displaystyle (x_{1},\ldots ,x_{k})}
כאשר
x
i
=
α
i
−
1
α
0
−
K
,
α
i
>
1
{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\qquad \alpha _{i}>1}
.
התפלגות שולית
ההתפלגות השוליות הן התפלגויות בטא [5]
X
i
∼
Beta
(
α
i
,
α
0
−
α
i
)
{\displaystyle X_{i}\sim \operatorname {Beta} (\alpha _{i},\alpha _{0}-\alpha _{i})}
.
S. Kotz; N. Balakrishnan; N. L. Johnson (2000). Continuous Multivariate Distributions. Volume 1: Models and Applications . New York: Wiley. ISBN 978-0-471-18387-7 . (Chapter 49: Dirichlet and Inverted Dirichlet Distributions)