EM-алгоритм

EM-алгоритм (англ. Expectation-maximization (EM) algorithm) — алгоритм, що використовується в математичній статистиці для знаходження оцінок максимальної схожості параметрів ймовірних моделей, у випадку, коли модель залежить від деяких прихованих змінних. Кожна ітерація алгоритму складається з двох кроків. На E-кроці (expectation) вираховується очікуване значення функції правдоподібності, при цьому приховані змінні розглядаються як спостережувані. На M-кроці (maximization) вираховується оцінка максимальної схожості, таким чином збільшується очікувана схожість, вирахувана на E-кроці. Потім це значення використовується для E-кроку на наступній ітерації. Алгоритм виконується до збіжності.

Часто EM-алгоритм використовують для розділення суміші функції Гауса.

Нехай ${\textbf {X}}$ — деяке з значень спостережуваних змінних, а ${\textbf {T}}$ — прихованні змінні. Разом ${\textbf {X}}$ і ${\textbf {T}}$ утворюють повний набір даних. Взагалі, ${\textbf {T}}$ може бути деякою підказкою, яка полегшує рішення проблеми у випадку, якщо вона відома. Наприклад, якщо є суміш розподілів, функція правдоподібності легко виражається через параметри відокремлених розподілів суміші.

Покладемо $p\,$ — густину імовірності (в безперервному випадку) або функція ймовірностей (в дискретному випадку) повного набору даних з параметрами $\Theta$ : $p(\mathbf {X} ,\mathbf {T} |\Theta ).$ Цю функцію можна розуміти як правдоподібність всієї моделі, якщо розглядати її як функцію параметрів $\Theta$ . Зауважимо, що умовний розподіл прихованої компоненти при деякому спостереженні та фіксованому наборі параметрів може бути вираженим так:

p(\mathbf {T} |\mathbf {X} ,\Theta )={\frac {p(\mathbf {X} ,\mathbf {T} |\Theta )}{p(\mathbf {X} |\Theta )}}={\frac {p(\mathbf {X} |\mathbf {T} ,\Theta )p(\mathbf {T} |\Theta )}{\int p(\mathbf {X} |\mathbf {\hat {T}} ,\Theta )p(\mathbf {\hat {T}} |\Theta )d\mathbf {\hat {T}} }}

використовуючи розширену формулу Байеса і формулу повної ймовірності. Таким чином, нам необхідно знати тільки розподіл спостережуваної компоненти при фіксованій прихованій $p(\mathbf {X} |\mathbf {T} ,\Theta )$ і ймовірності прихованих даних $p(\mathbf {T} |\Theta )$ .

EM-алгоритм ітеративно покращує початкову оцінку $\Theta _{0}$ , обчислюючи нові значення оцінок $\Theta _{1},\Theta _{2},$ і так далі. На кожному кроці перехід до $\Theta _{n+1}\,$ від $\Theta _{n}\,$ виконується таким чином:

\Theta _{n+1}=\arg \max _{\Theta }Q(\Theta )

де $Q(\Theta )$ — математичне сподівання логарифма правдоподібності. Іншими словами, ми не можемо відразу обчислити точну правдоподібність, але за відомими даними ( $X$ ) ми можемо знайти апостеріорну оцінку ймовірностей для різних значень прихованих змінних $T$ . Для кожного набору значень $T$ і параметрів $\Theta$ ми можемо обчислити математичне сподівання функції правдоподібності з даного набору $X$ . Воно залежить від попереднього значення $\Theta$ , бо це значення впливає на ймовірності прихованих змінних $T$ .

$Q(\Theta )$ обчислюється таким чином:

Q(\Theta )=E_{\mathbf {T} }\!\!\left[\log p\left(\mathbf {X} ,\mathbf {T} \,|\,\Theta \right){\Big |}\mathbf {X} \right]

тобто умовне математичне сподівання $\log p\left(\mathbf {X} ,\mathbf {T} \,|\,\Theta \right)$ при умові $\Theta$ .

Іншими словами, $\Theta _{n+1}$ — це значення, максимізуючи (M) умовне математичне сподівання (E) логарифма правдоподібності при даних значеннях спостережуваних змінних і попередньому значенні параметрів. У безперервному випадку значення $Q(\Theta )$ вираховується так:

Q(\Theta )=E_{\mathbf {T} }\!\!\left[\log p\left(\mathbf {X} ,\mathbf {T} \,|\,\Theta \right){\Big |}\mathbf {X} \right]=\int _{-\infty }^{\infty }p\left(\mathbf {T} \,|\,\mathbf {X} ,\Theta _{n}\right)\log p\left(\mathbf {X} ,\mathbf {T} \,|\,\Theta \right)d\mathbf {T}

EM-алгоритм

Опис алгоритму

Альтернативний опис

Примітки

Посилання

Wikiwand - on