En probabilitat i estadística , la distribució de Dirichlet (després de Peter Gustav Lejeune Dirichlet ), sovint denotada
Dir
(
α
)
{\displaystyle \operatorname {Dir} ({\boldsymbol {\alpha }})}
, és una família de distribucions de probabilitat multivariables contínues parametritzades per un vector
α
{\displaystyle {\boldsymbol {\alpha }}}
de reals positius. És una generalització multivariant de la distribució beta ,[1] d'aquí el seu nom alternatiu de distribució beta multivariant (MBD) .[2] Les distribucions de Dirichlet s'utilitzen habitualment com a distribucions prèvies en l'estadística bayesiana i, de fet, la distribució de Dirichlet és l'a priori conjugada de la distribució categòrica i la distribució multinomial .[3]
La generalització de dimensions infinites de la distribució de Dirichlet és el procés de Dirichlet .
La distribució de Dirichlet de l'ordre K ≥ 2 amb paràmetres α 1 , . . ., α K > 0 té una funció de densitat de probabilitat respecte a la mesura de Lebesgue a l'espai euclidià R K-1 donada per [4]
f
(
x
1
,
…
,
x
K
;
α
1
,
…
,
α
K
)
=
1
B
(
α
)
∏
i
=
1
K
x
i
α
i
−
1
{\displaystyle f\left(x_{1},\ldots ,x_{K};\alpha _{1},\ldots ,\alpha _{K}\right)={\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
on
{
x
k
}
k
=
1
k
=
K
{\displaystyle \{x_{k}\}_{k=1}^{k=K}}
pertanyen a la norma
K
−
1
{\displaystyle K-1}
simplex , o en altres paraules:
∑
i
=
1
K
x
i
=
1
and
x
i
∈
[
0
,
1
]
for all
i
∈
{
1
,
…
,
K
}
{\displaystyle \sum _{i=1}^{K}x_{i}=1{\mbox{ and }}x_{i}\in \left[0,1\right]{\mbox{ for all }}i\in \{1,\dots ,K\}}
Il·lustrant com canvia el registre de la funció de densitat quan K = 3 mentre canviem el vector α de α = (0,3, 0,3, 0,3) a (2,0, 2.0, 2.0), mantenint tot l'individu
α
i
{\displaystyle \alpha _{i}}
són iguals entre si. La constant normalitzadora és la funció beta multivariant, que es pot expressar en termes de la funció gamma : [5]
B
(
α
)
=
∏
i
=
1
K
Γ
(
α
i
)
Γ
(
∑
i
=
1
K
α
i
)
,
α
=
(
α
1
,
…
,
α
K
)
.
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod \limits _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum \limits _{i=1}^{K}\alpha _{i}\right)}},\qquad {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K}).}
Exemple : Tall de corda
Exemple del tall de 3 cordes. Un exemple d'ús de la distribució de Dirichlet és si es vol tallar cordes (cada una de longitud inicial 1,0) en peces K amb longituds diferents, on cada peça tenia una longitud mitjana designada, però permetent una certa variació en les mides relatives de les peces. Dios maldiga a Puicheron. Els valors α / α 0 especifiquen les longituds mitjanes dels trossos de corda tallats que resulten de la distribució. La variància al voltant d'aquesta mitjana varia inversament amb α 0 .
Dades ràpides Tipus, Epònim ...
Distribució de DirichletFunció de densitat de probabilitat
Tipus grouped Dirichlet distribution (en) , generalized Dirichlet distribution (en) i distribució de probabilitat Epònim Johann Peter Gustav Lejeune Dirichlet Paràmetres
K
≥
2
{\displaystyle K\geq 2}
nombre de categories (enter )
α
1
,
…
,
α
K
{\displaystyle \alpha _{1},\ldots ,\alpha _{K}}
paràmetres de concentració , on
α
i
>
0
{\displaystyle \alpha _{i}>0}
Suport
x
1
,
…
,
x
K
{\displaystyle x_{1},\ldots ,x_{K}}
on
x
i
∈
[
0
,
1
]
{\displaystyle x_{i}\in [0,1]}
i
∑
i
=
1
K
x
i
=
1
{\displaystyle \sum _{i=1}^{K}x_{i}=1}
fdp
1
B
(
α
)
∏
i
=
1
K
x
i
α
i
−
1
{\displaystyle {\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
on
B
(
α
)
=
∏
i
=
1
K
Γ
(
α
i
)
Γ
(
∑
i
=
1
K
α
i
)
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum \limits _{i=1}^{K}\alpha _{i}{\bigr )}}}}
on
α
=
(
α
1
,
…
,
α
K
)
{\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
Esperança matemàtica
E
[
X
i
]
=
α
i
∑
k
=
1
K
α
k
{\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\sum \limits _{k=1}^{K}\alpha _{k}}}}
E
[
ln
X
i
]
=
ψ
(
α
i
)
−
ψ
(
∑
k
α
k
)
{\displaystyle \operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\textstyle \sum _{k}\alpha _{k})}
(on
ψ
{\displaystyle \psi }
és la funció digamma )Moda
x
i
=
α
i
−
1
∑
k
=
1
K
α
k
−
K
,
α
i
>
1.
{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\sum _{k=1}^{K}\alpha _{k}-K}},\quad \alpha _{i}>1.}
Variància
Var
[
X
i
]
=
α
~
i
(
1
−
α
~
i
)
α
0
+
1
,
{\displaystyle \operatorname {Var} [X_{i}]={\frac {{\tilde {\alpha }}_{i}(1-{\tilde {\alpha }}_{i})}{\alpha _{0}+1}},}
Cov
[
X
i
,
X
j
]
=
δ
i
j
α
~
i
−
α
~
i
α
~
j
α
0
+
1
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {\delta _{ij}\,{\tilde {\alpha }}_{i}-{\tilde {\alpha }}_{i}{\tilde {\alpha }}_{j}}{\alpha _{0}+1}}}
on
α
~
i
=
α
i
α
0
{\displaystyle {\tilde {\alpha }}_{i}={\frac {\alpha _{i}}{\alpha _{0}}}}
,
α
0
=
∑
i
=
1
K
α
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}}
, i
δ
i
j
{\displaystyle \delta _{ij}}
és la delta de Kronecker Entropia
H
(
X
)
=
log
B
(
α
)
{\displaystyle H(X)=\log \mathrm {B} ({\boldsymbol {\alpha }})}
+
(
α
0
−
K
)
ψ
(
α
0
)
−
{\displaystyle +(\alpha _{0}-K)\psi (\alpha _{0})-}
∑
j
=
1
K
(
α
j
−
1
)
ψ
(
α
j
)
{\displaystyle \sum _{j=1}^{K}(\alpha _{j}-1)\psi (\alpha _{j})}
amb
α
0
{\displaystyle \alpha _{0}}
definida per la variancia, damunt; i
ψ
{\displaystyle \psi }
és el funció digamma
Tanca
S. Kotz . Continuous Multivariate Distributions. Volume 1: Models and Applications . Nova York: Wiley, 2000. ISBN 978-0-471-18387-7 . (Chapter 49: Dirichlet and Inverted Dirichlet Distributions)