Приблизне баєсове обчислення

Прибли́зне ба́єсове обчи́слення (ПБО, англ. Approximate Bayesian computation, ABC) складає клас обчислювальних методів^[en], що беруть свої корені з баєсової статистики. В усіх методах статистичного висновування на основі моделей центральне значення має функція правдоподібності, оскільки вона виражає ймовірність спостережуваних даних згідно певної статистичної моделі, і таким чином кількісно оцінює дані, що підтримують певні значення параметрів та обирання серед різних моделей. Для простих моделей формулу функції правдоподібності зазвичай може бути виведено аналітично. Однак для складніших моделей аналітична формула може бути невиразною, або оцінка функції правдоподібності може бути дуже витратною обчислювально.

Методи ПБО уникають обчислення функції правдоподібності. Таким чином, методи ПБО розширюють сферу моделей, для яких може розглядатися статистичне висновування. Методи ПБО є математично обґрунтованими, але вони неминуче роблять припущення та наближення, що потребують ретельної оцінки. Крім того, ширша область застосування ПБО посилює проблеми оцінки параметрів та обирання моделі.

Останніми роками ПБО швидко завоювало популярність, зокрема для аналізу складних задач, що виникають в біологічних науках, наприклад, в популяційній генетиці, екології, епідеміології та системній біології.

Історія

Узагальнити

Перспектива

Перші ідеї, пов'язані з ПБО, сходять до 1980-х років. Дональд Рубін^[en] (англ. Donald Rubin), обговорюючи інтерпретацію баєсових викладів у 1984 році,^[1] описав гіпотетичний механізм вибірки, що дає вибірку з апостеріорного розподілу. Ця схема була більше концептуальним уявним експериментом для демонстрації, якого типу маніпуляції здійснюються при отримуванні висновків про апостеріорні розподіли параметрів. Опис цього механізму вибірки в точності збігається зі схемою ПБО-відхилення, і цю статтю можна розглядати як перший опис приблизного баєсового обчислення. Проте двоетапний шаховий порядок^[en] було побудовано Френсісом Гальтоном (англ. Francis Galton) у пізніх 1800-х, що можна побачити як фізичну реалізацію схеми ПБО-відхилення для одного невідомого (параметра) та одного спостереження — див. мал. 5 у S. Stigler 2010. Інше передбачення було зроблено Рубіним, коли він переконував, що прикладні статистики не повинні обмежуватися в баєсовому висновуванні лише тими моделями, що піддаються аналітичній обробці, а натомість розглядати обчислювальні методи, що дозволяють їм оцінювати потрібний апостеріорний розподіл. Таким чином може розглядатися ширший спектр моделей. Ці аргументи є особливо актуальними в контексті ПБО.

У 1984 році Пітер Дігл^[en] (англ. Peter Diggle) та Річард Греттон (англ. Richard Gratton)^[2] запропонували застосовувати схему систематичної симуляції для наближення функції правдоподібності, коли її аналітична форма є непіддатливою. Їхній метод ґрунтувався на визначенні ґратки в просторі параметрів та використанні її для наближення правдоподібності шляхом виконання декількох симуляцій для кожної з точок ґратки. Наближення потім покращувалося застосуванням згладжувальних прийомів до виходів цих симуляцій. І хоча ідея використання симуляцій для перевірки гіпотез не була новою,^[3]^[4] Дігл та Греттон, очевидно, запропонували першу процедуру використання симуляції для здійснення статистичного висновування за умов, коли правдоподібність є непіддатливою.

Хоча підхід Дігла та Греттона й відкрив нові обрії, їхній метод не був повністю ідентичним тому, що тепер відоме як ПБО, оскільки його спрямовано на наближення правдоподібності, замість апостеріорного розподілу. Стаття Саймона Таваре^[en] (англ. Simon Tavaré) та ін.^[5] була першою, в якій було запропоновано алгоритм ПБО для апостеріорного висновування. В їхній новаторській праці розглядалося висновування стосовно генеалогії даних послідовностей ДНК, зокрема задача визначення апостеріорного розподілу часу до останнього спільного предка вибраних особин. Таке висновування є аналітично непіддатливим для багатьох демографічних моделей, але автори представили шляхи симуляції зрощених дерев згідно передбачуваних моделей. Вибірку з апостеріорного розподілу параметрів моделі було отримувано шляхом прийняття/відхилення припущень на підставі порівняння кількості відокремлених популяцій у синтетичних та реальних даних. За цією працею послідувало прикладне дослідження Джонатана Прічарда^[en] (англ. Jonathan K. Pritchard) та ін.^[6] моделювання варіацій в людській Y-хромосомі із застосуванням методу ПБО. Нарешті, термін «приблизне баєсове обчислення» започаткували Марк Бомон (англ. Mark Beaumont) та ін.,^[7] додатково розширивши методологію ПБО, та конкретніше обговоривши придатність підходу ПБО для задач у популяційній генетиці. Відтоді ПБО набуло поширення в застосуваннях за межами популяційної генетики, таких як системна біологія, епідеміологія або філогеографія^[en].

Метод

Обґрунтування

Поширене втілення теореми Баєса ставить у відповідність умовну ймовірність (або густину) певного значення параметра $\theta$ при заданих даних $D$ до ймовірності $D$ при заданому $\theta$ за правилом:

p(\theta |D)={\frac {p(D|\theta )p(\theta )}{p(D)}}

де $p(\theta |D)$ позначає апостеріорне, $p(D|\theta )$ — правдоподібність, $p(\theta )$ — апріорне, а $p(D)$ — свідчення (що також називають відособленою правдоподібністю, або апріорною передбачуваною правдоподібністю даних).

Апріорне представляє переконання про $\theta$ до того, як стало доступним $D$ , і його часто вказують, обираючи певний розподіл з набору добре відомих та піддатливих сімейств розподілів, так, щоби як обчислення апріорних ймовірностей, так і випадкова генерація значень $\theta$ були відносно безпосередніми. Для деяких різновидів моделей прагматичніше вказувати апріорне $p(\theta )$ , застосовуючи розклад спільного розподілу всіх елементів $\theta$ в термінах послідовності їхніх умовних розподілів. Якщо цікавлять лише відносні ймовірності різних значень $\theta$ , то свідченням $p(D)$ можна знехтувати, оскільки воно складає нормувальну сталу^[en], що скасовується для будь-якого відношення апостеріорних імовірностей. Залишається, однак, необхідність обрахунку правдоподібності $p(D|\theta )$ та апріорного $p(\theta )$ . Для численних застосувань обрахунок правдоподібності є обчислювально витратним або й зовсім непіддатливим,^[8] що спонукає до застосування ПБО для обходу цієї проблеми.

Алгоритм відхилення ПБО

Узагальнити

Перспектива

Всі методи на основі ПБО наближують функцію правдоподібності шляхом симуляцій, виходи яких порівнюють зі спостережуваними даними.^[9]^[10]^[11] Конкретніше, в алгоритмі відхилення ПБО, найбазовішій формі ПБО, спочатку вибирається набір точок параметрів з апріорного розподілу. Потім для заданої вибраної точки параметру ${\hat {\theta }}$ симулюється набір даних ${\hat {D}}$ згідно статистичної моделі $M$ , визначеної параметрами $\theta$ . Якщо ці згенеровані ${\hat {D}}$ надто відрізняються від спостережуваних даних $D$ , то вибране значення параметру відхиляється. У точніших термінах, ${\hat {D}}$ приймається з допуском $\epsilon \geq 0$ , якщо:

\rho ({\hat {D}},D)\leq \epsilon

де міра відстані $\rho ({\hat {D}},D)$ визначає рівень розбіжності між ${\hat {D}}$ та $D$ на основі заданої метрики (наприклад, евклідової відстані). Як правило, потрібен суворо додатній допуск, оскільки ймовірність того, що вихід симуляції точно збіжиться з даними (подія ${\hat {D}}=D$ ) є незначною для всіх застосувань ПБО, крім найпримітивніших, що на практиці вело би до відхилення майже всіх вибраних точок параметрів. Виходом алгоритму відхилення ПБО є вибірка значень параметрів, розподілена приблизно відповідно до бажаного апостеріорного розподілу, та, найголовніше, отримана без потреби явного обчислення функції правдоподібності (мал. 1).

Зведена статистика

Ймовірність генерування набору даних ${\hat {D}}$ з малою відстанню до $D$ зазвичай зменшується з ростом розмірності даних. Це призводить до суттєвого зменшення обчислювальної ефективності наведеного вище базового алгоритму відхилення ПБО. Загальним підходом до зменшення цієї проблеми є заміна $D$ набором зведеної статистики $S(D)$ з меншою розмірністю, який обирається таким чином, щоби охопити доречну інформацію в $D$ . Критерій прийнятності в алгоритмі відхилення ПБО стає таким:

\rho (S({\hat {D}}),S(D))\leq \epsilon

Якщо зведена статистика є достатньою по відношенню до параметрів моделі $\theta$ , то отримуване таким чином підвищення ефективності не привносить жодних помилок.^[12] Дійсно, за визначенням, достатність означає, що всю інформацію в $D$ про $\theta$ охоплено в $S(D)$ .

Як деталізовано нижче, ідентифікувати скінченномірний набір зведеної статистики за межами експоненційного сімейства^[en] зазвичай неможливо. Тим не менш, у випадках, коли висновування здійснюється методами ПБО, часто застосовуються інформативні, але, можливо, не достатні зведені статистики.

Приклад

Узагальнити

Перспектива

Ілюстративним прикладом є бістабільна система, яку може бути охарактеризовано прихованою марковською моделлю (ПММ) в умовах зашумлених вимірювань (Мал. 2). Такі моделі використовують для багатьох біологічних систем: наприклад, їх можуть застосовувати до еволюції, сигнальних систем клітин, активації/деактивації, логічної обробки та нерівноважної термодинаміки. Наприклад, поведінка фактора транскрипції сигнального білка (англ. Sonic hedgehog, Shh) у чорночеревій дрозофілі може моделюватися за допомогою ПММ.^[13] (Біологічна) динамічна модель складається з двох станів: A та B. Якщо ймовірність переходу з одного стану до іншого визначається як $\theta$ в обох напрямках, то ймовірністю залишитися в тому ж стані на кожному такті є 1- $\theta$ . Ймовірністю виміряти стан правильно є $\gamma$ (і навпаки, ймовірністю неправильного вимірювання є 1- $\gamma$ ).

Через умовні залежності між станами в різні моменти часу обчислення правдоподібності даних часових рядів є дещо нудним, що ілюструє спонукання до застосування ПБО. Обчислювальною проблемою для базового ПБО є велика розмірність даних у застосуваннях на кшталт цього. Її може бути зменшено застосуванням зведеної статистики S, що є частотою перемикань між двома станами. Як метрика відстані $\rho (\cdot ,\cdot )$ застосовується абсолютна відстань у поєднанні з допуском $\epsilon =2$ . Апостеріорне висновування стосовно параметра $\theta$ може бути здійснено шляхом п'ятьох кроків, представлених на мал. 1:

Крок 1: Припустімо, що спостережувані дані є послідовністю станів AAAABAABBAAAAAABAAAA, що було згенеровано з використанням $\theta =0.25$ та $\gamma =0.8$ . Пов'язаною зведеною статистикою, кількістю перемикань між станами, в експериментальних даних є $\omega _{E}=6$ .

Крок 2: Виходячи з припущення, що про $\theta$ не відомо нічого, застосовується рівномірний апріорний розподіл на проміжку $[0,1]$ . Параметр $\gamma$ вважається відомим та фіксованим у значенні, з яким генерувалися дані ( $\gamma =0.8$ ), але в загальному випадку його може бути оцінено зі спостережень. З апріорного береться n точок параметрів, і модель симулюється для кожної з точок параметрів $\theta _{i},i=1,\ldots ,n$ , що дає в результаті $n$ послідовностей симульованих даних. В цьому прикладі n=5, а кожен взятий параметр та симульований запис набору даних містяться в стовпчиках 2-3 таблиці 1. На практиці для отримання придатної інформації n повинно бути набагато більшим.

Більше інформації

, ...

Таблиця 1: Приклад алгоритму відхилення ПБО
i	$\theta _{i}$	Симульовані набори даних (крок 2)	Зведена статистика $\omega _{S,i}$ (крок 3)	Відстань $\rho (\omega _{S,i},\omega _{E})$ (крок 4)	Вихід (крок 4)
1	0.08	AABAAAABAABAAABAAAAA	8	2	прийнято
2	0.68	AABBABABAAABBABABBAB	13	7	відхилено
3	0.87	BBBABBABBBBABABBBBBA	9	3	відхилено
4	0.43	AABAAAAABBABBBBBBBBA	6	0	прийнято
5	0.53	ABBBBBAABBABBABAABBB	9	3	відхилено

Закрити

Крок 3: Зведена статистика обчислюється для кожної послідовності симульованих даних, $\omega _{S,i},i=1,\ldots ,n$ (стовпчик 4 таблиці 1).

Крок 4: Відстані між спостережуваними та симульованими послідовностями переходів $\rho (\omega _{S,i},\omega _{E})=|\omega _{S,i}-\omega _{E}|$ обчислюються для всіх точок параметрів (стовпчик 5 таблиці 1). Точки параметрів, для яких відстань є меншою або рівною $\epsilon$ , приймаються як приблизні приклади з апостеріорного (стовпчик 6 таблиці 1).

Крок 5: Апостеріорний розподіл наближується прийнятими точками параметрів. Апостеріорний розподіл повинен мати не-незначну ймовірність значень параметрів в області навколо істинного значення $\theta$ в системі, якщо дані є достатньо інформативними. В цьому прикладі масу апостеріорної ймовірності рівномірно поділено між значеннями 0.08 та 0.43.

Малюнок 3 показує апостеріорні ймовірності, отримані за допомогою ПБО та великого n з використанням або зведеної статистики у поєднанні з ( $\epsilon =0$ та $\epsilon =2$ ), або повної послідовності даних. Вони порівнюються зі справжнім апостеріорним, що може бути обчислено точно та ефективно за допомогою алгоритму Вітербі. Використана зведена статистика не є достатньою, і це видно з того, що навіть при $\epsilon =0$ відхилення від теоретичного апостеріорного є значним. Слід зазначити, що для отримання апостеріорного, що буде зосереджено навколо справжнього значення $\theta$ ( $\theta =0.25$ ), знадобиться значно довша послідовність даних спостережень.

Цей приклад застосування ПБО використовує спрощення для ілюстративних цілей. Ряд оглядових статей пропонують посилання на реалістичніші застосування ПБО.^[9]^[10]^[11]^[14]

Порівняння моделей за допомогою ПБО

Узагальнити

Перспектива

Крім оцінки параметрів, модель ПБО може застосовуватися для обчислення апостеріорних імовірностей різних моделей-кандидатів.^[15]^[16]^[17] У таких застосуваннях однією з можливостей є застосування відхилення-вибірки в ієрархічному порядку. Спершу з апріорного розподілу моделей береться модель; потім, для взятої моделі, параметри моделі вибираються з апріорного розподілу, що відповідає цій моделі. Нарешті, симуляція виконується так, як в одномодельному ПБО. Тепер відносні частоти прийняття для різних моделей наближують апостеріорний розподіл для цих моделей. Знову ж таки, пропонувалися обчислювальні вдосконалення ПБО у просторі моделей, такі як побудова частинкового фільтру^[en] в сукупному просторі моделей та параметрів.^[17]

Щойно оцінено апостеріорні ймовірності моделей, можна повною мірою скористатися методиками баєсового порівняння моделей. Наприклад, для порівняння відносних імовірностей двох моделей $M_{1}$ та $M_{2}$ можна обчислювати їхнє апостеріорне відношення, що пов'язане з коефіцієнтом Баєса $B_{1,2}$ :

{\frac {p(M_{1}|D)}{p(M_{2}|D)}}={\frac {p(D|M_{1})}{p(D|M_{2})}}{\frac {p(M_{1})}{p(M_{2})}}=B_{1,2}{\frac {p(M_{1})}{p(M_{2})}}

Якщо апріорні моделей є однаковими ( $p(M_{1})=p(M_{2})$ ), коефіцієнт Баєса дорівнює відношенню апостеріорних.

На практиці, як обговорюється нижче, ці заходи можуть бути дуже чутливими до вибору параметрів апріорних розподілів та зведеної статистики, і, таким чином, висновки з порівняння моделей слід робити з обережністю.

Пастки, та засоби подолання

Узагальнити

Перспектива

Більше інформації Джерело помилки, Потенційна проблема ...

Таблиця 2: Потенціальні ризики та пастки в статистичному висновуванні на основі ПБО
Джерело помилки	Потенційна проблема	Розв'язання	Розділ
Ненульовий допуск ε	Неточність вносить відхилення до обчислюваного апостеріорного розподілу.	Теоретичні/практичні дослідження чутливості апостеріорного розподілу до допуску. Зашумлене ПБО.	#Наближення апостеріорного
Не достатня зведена статистика	Втрата інформації призводить до роздування ймовірних інтервалів.	Автоматичний вибір / напівавтоматична ідентифікація достатньої статистики. Перевірки достовірності моделі (напр., Темплтон, 2009^[18]).	#Вибір та достатність зведеної статистикиВибір та достатність зведеної статистики
Мала кількість моделей / Невірно вказані моделі	Досліджувані моделі не є репрезентативними / брак передбачувальної сили.	Ретельний відбір моделей. Оцінка передбачувальної сили.	#Мала кількість моделей
Апріорні та діапазони параметрів	Висновки можуть бути чутливими до вибору апріорних. Вибір моделі може бути безглуздим.	Перевіряти чутливість коефіцієнтів Баєса до вибору апріорних. Доступні деякі теоретичні результати стосовно вибору апріорних. Використовувати альтернативні методи перевірки достовірності моделей.	#Апріорний розподіл та діапазони параметрів
Прокляття розмірності	Низький темп прийняття параметрів. Помилки моделей неможливо відрізнити від недостатньої дослідженості простору параметрів. Ризик перенавчання.	Методи зменшення моделей, якщо вони застосовні. Методи для прискорення дослідження параметрів. Контроль якості для виявлення перенавчання.	#Прокляття розмірності
Ранжування моделей зі зведеною статистикою	Розрахунок коефіцієнтів Баєса на зведеній статистиці може не відповідати коефіцієнтам Баєса на вихідних даних, що може призводити до видачі безглуздих результатів.	Використовувати лише такі зведені статистики, що задовольняють необхідні та достатні вимоги для отримання несуперечливого баєсового вибору моделі. Застосовувати альтернативні методи перевірки достовірності моделі.	#Коефіцієнт Баєса з ПБО та зведеною статистикою
Реалізація	Низький захист загальних припущень у процесах симуляції та висновування.	Перевірка працездатності за результатами. Стандартизація програмного забезпечення.	#Обов'язкові перевірки якості

Закрити

Як і для всіх статистичних методів, для застосування методів на основі ПБО до реальних задач моделювання є обов'язково необхідним ряд припущень та наближень. Наприклад, встановлення параметра допуску $\epsilon$ в нуль забезпечує точний результат, але зазвичай робить обчислення занадто витратним. Тому на практиці застосовуються значення $\epsilon$ більше нуля, що вносить відхилення. Також, достатні зведені статистики зазвичай не є доступними, і натомість застосовуються інші зведені статистики, що привносить додаткове відхилення в силу втрати інформації. Додаткові джерела відхилення, наприклад, у контексті вибору моделі, можуть бути витонченішими.^[12]^[19]

В той же час, деякі з критичних зауважень, спрямовані на методи ПБО, зокрема в галузі філогеографії^[en],^[18]^[20]^[21] стосуються не особливостей ПБО, а всіх баєсових методів, або навіть всіх статистичних методів (наприклад, вибір апріорного розподілу та діапазонів параметрів).^[9]^[22] Тим не менш, через здатність методів ПБО мати справу із значно складнішими моделями, деякі з цих загальних пасток мають особливе значення в контексті аналізу ПБО.

В цьому розділі обговорюються ці потенційні ризики, та робиться огляд можливих шляхів їхнього подолання (таблиця 2).

Наближення апостеріорного

Не-незначний $\epsilon$ дається такою ціною, що вибірка робиться з $p(\theta |\rho ({\hat {D}},D)\leq \epsilon )$ замість справжнього апостеріорного $p(\theta |D)$ . За достатньо малого допуску та чутливої метрики відстані, отримуваний в результаті розподіл $p(\theta |\rho ({\hat {D}},D)\leq \epsilon )$ повинен часто наближувати справжній цільовий розподіл $p(\theta |D)$ достатньо добре. З іншого боку, настільки великий допуск, що кожна з точок простору параметрів стає прийнятою, видасть дублікат апріорного розподілу. Існують емпіричні дослідження різниці між $p(\theta |\rho ({\hat {D}},D)\leq \epsilon )$ та $p(\theta |D)$ як функції від $\epsilon$ ,^[23] та теоретичні результати для верхньої межі помилки оцінок параметрів у залежності від $\epsilon$ .^[24] Також було досліджено точність апостеріорного (визначену як очікувані квадратичні втрати), що породжує ПБО, як функцію від $\epsilon$ .^[25] Тим не менш, збіжність розподілів при наближенні $\epsilon$ до нуля та її залежність від застосовуваної метрики відстані є важливою темою, що ще має бути досліджено докладніше. Зокрема, залишається складним відокремити помилки, внесені цим наближенням, від помилок через неправильне визначення моделі.^[9]

Як спроба виправлення деяких із помилок, спричинених ненульовим $\epsilon$ , було запропоновано використання з ПБО локальної зваженої лінійної регресії, щоби зменшити розбіжність апостеріорних оцінок.^[7] Цей метод призначає вагові коефіцієнти параметрам у відповідності до того, наскільки добре симульовані підсумки відповідають спостережуваним, і виконує лінійну регресію між підсумками та зваженими параметрами в околі спостережуваних підсумків. Отримувані коефіцієнти регресії використовуються для коригування параметрів, що обираються, в напрямку спостережуваних підсумків. Було запропоновано вдосконалення у вигляді нелінійної регресії із застосуванням штучної нейронної мережі прямого поширення.^[26] Проте, було показано, що апостеріорні розподіли, отримані із застосуванням цих підходів, не завжди конзистентні з апріорним розподілом, і відтак запропоновано переформулювання налаштувань регресії, яке бере до уваги апріорний розподіл.^[27]

Нарешті, статистичне висновування із застосуванням ПБО з ненульовим допуском $\epsilon$ не є властиво вадливим: за припущення наявності помилок вимірювання може бути фактично показано, що оптимальний $\epsilon$ є не нульовим.^[25]^[28] Дійсно, відхилення, спричинене ненульовим допуском, може бути характеризовано та компенсовано введенням певного виду шуму до зведеної статистики. Було встановлено асимптотичну конзистентність такого «зашумленого ПБО», а також формули асимптотичної дисперсії оцінок параметрів для фіксованого допуску.^[25]

Вибір та достатність зведеної статистики

Зведена статистика може застосовуватися для збільшення темпу прийняття ПБО для даних високої розмірності. Для цієї мети оптимальною є достатня зведена статистика невисокої розмірності, оскільки вона охоплює всю доречну інформацію, що є в даних, у найпростішому вигляді з можливих.^[11] Однак, достатні статистики низької розмірності зазвичай є недосяжними для тих статистичних моделей, для яких висновування на основі ПБО є найдоречнішим, і тому для знаходження зведених статистик невеликої розмірності зазвичай потрібна певна евристика. Використання набору погано обраної зведеної статистики часто призводить до роздування ймовірних інтервалів з причини закладеної втрати інформації,^[11] що також може вносити відхилення й до розрізнення моделей. Існує огляд методів обрання зведених статистик,^[29] що може слугувати гарним керівництвом на практиці.

Одним з підходів для охоплення якомога більше наявної в даних інформації було би використання багатьох статистик, але виявляється, що точність та стабільність ПБО швидко знижуються зі збільшенням числа зведених статистик.^[9]^[11] Натомість кращою стратегією є фокусуватися лише на доречних статистиках — доречність відносно проблеми висновування в цілому, використовуваної моделі, та даних, що є в розпорядженні.^[30]

Було запропоновано алгоритм ідентифікації репрезентативної підмножини зведених статистик шляхом оцінювання, чи привносить додаткова статистика значущу зміну до апостеріорного.^[31] Однією з проблем тут є те, що велика помилка наближення ПБО може сильно вплинути на висновки про корисність статистики на будь-якому кроці цієї процедури. Інший метод^[30] розкладається на два основних кроки. Спершу будується контрольне апостеріорне шляхом мінімізації ентропії. Потім набори-кандидати статистик оцінюються шляхом порівняння наближених за допомогою ПБО апостеріорних із контрольним апостеріорним.

За обох цих стратегій підмножина статистик обирається з більшого набору статистик-кандидатів. Натомість, підхід частинних найменших квадратів^[en] використовує інформацію з усіх статистик-кандидатів, кожної з відповідним ваговим коефіцієнтом.^[32] Останнім часом значний інтерес привернув метод побудови зведених статистик напівавтоматичним способом.^[25] Цей метод засновано на спостереженні, що оптимальний вибір зведених статистик при мінімізації квадратичних втрат оцінок точок параметрів може бути отримано через апостеріорне середнє параметрів, яке наближується виконанням лінійної регресії на основі симульованих даних.

Істотне значення матимуть методи ідентифікації зведених статистик, що могли би також одночасно оцінювати вплив на наближення апостеріорного.^[33] Причина в тому, що вибір зведених статистик та вибір допуску складають два джерела помилки в отримуваному в результаті апостеріорному розподілі. Ці помилки можуть спотворювати ранжування моделей, а також можуть призводити до неточних передбачень моделей. Дійсно, жоден із наведених вище методів не оцінює вибір зведених статистик з метою вибору моделі.

Коефіцієнт Баєса з ПБО та зведеною статистикою

Було показано, що поєднання не достатньої зведеної статистики та ПБО може бути проблематичним для вибору моделі.^[12]^[19] Справді, якщо позначити коефіцієнт Баєса на основі зведеної статистики $S(D)$ як $B_{1,2}^{s}$ , то співвідношення між $B_{1,2}$ та $B_{1,2}^{s}$ набуває такого вигляду:^[12]

B_{1,2}={\frac {p(D|M_{1})}{p(D|M_{2})}}={\frac {p(D|S(D),M_{1})}{p(D|S(D),M_{2})}}{\frac {p(S(D)|M_{1})}{p(S(D)|M_{2})}}={\frac {p(D|S(D),M_{1})}{p(D|S(D),M_{2})}}B_{1,2}^{s}

Отже, зведена статистика $S(D)$ є достатньою для порівняння двох моделей $M_{1}$ та $M_{2}$ якщо і лише якщо

p(D|S(D),M_{1})=p(D|S(D),M_{2})

що дає в результаті $B_{1,2}=B_{1,2}^{s}$ . З наведеного вище рівняння також ясно, що може існувати величезна різниця між $B_{1,2}$ та $B_{1,2}^{s}$ , якщо ця умова не задовольняється, що може бути показано на іграшкових прикладах.^[12]^[16]^[19] Врешті-решт було показано, що достатність для $M_{1}$ або $M_{2}$ по одному, або для обох моделей, не гарантує достатності для ранжування моделей.^[12] Проте, також було показано, що будь-яка достатня зведена статистика для моделі $M$ , в якій обидві моделі $M_{1}$ та $M_{2}$ є вкладеними^[en], є чинною для ранжування вкладених моделей^[en].^[12]

Обчислення коефіцієнтів Баєса на $S(D)$ може відтак бути оманливим для цілей вибору моделі, якщо відношення між коефіцієнтами Баєса на $D$ та $S(D)$ не буде відомим, або хоча б не буде достатньо добре наближуваним. Крім того, нещодавно було отримано необхідні та достатні умови на зведену статистику для стійкого баєсового вибору моделі,^[34] що можуть слугувати корисним керівництвом.

Тим не менш, це питання має відношення лише до такого вибору моделі, коли розмірність даних було зменшено. Висновування на основі ПБО, в якому порівнюються безпосередньо справжні набори даних, як у деяких застосуваннях в системній біології (наприклад, див.^[35]), уникає цієї проблеми.

Обов'язкові перевірки якості

Як стає зрозумілим із попереднього обговорення, будь-який ПБО-аналіз вимагає здійснення вибору та компромісів, що можуть мати значний вплив на його результати. А саме, вибір альтернативних моделей/гіпотез, кількості симуляцій, вибір зведеної статистики або порогового допуску наразі не можуть ґрунтуватися на загальних правилах; вплив цього вибору має оцінюватись і перевірятись у кожному дослідженні.^[10]

Було запропоновано ряд евристичних підходів до контролю якості ПБО, таких як кількісне вираження частки дисперсії параметру, що пояснюється зведеною статистикою.^[10] Звичайний клас методів націлено на визначення того, чи видає висновування вірні результати, не залежно від фактично спостережуваних даних. Наприклад, для заданого набору значень параметру, що зазвичай вибирається з апріорного або апостеріорного розподілів моделі, можна згенерувати велику кількість штучних наборів даних. Таким чином, якість та надійність висновування ПБО може бути оцінено в контрольованих умовах, шляхом здійснення замірів, наскільки добре обране висновування ПБО виявляє справжні значення параметру, а також моделює, чи декілька структурно відмінних моделей розглядаються одночасно.

Інший клас методів визначає, чи було висновування успішним у світлі заданих спостережуваних даних, наприклад, шляхом порівняння апостеріорного передбачуваного розподілу^[en] зведеної статистики зі спостережуваною зведеною статистикою.^[10] Крім того, перспективні майбутні стратегії оцінки стабільності висновувань ПБО та їхньої передбачувальної достовірності за межами вибірки представляють методики перехресного затверджування^[36] та передбачувальної перевірки^[en].^[37]^[38] Це особливо важливо при моделюванні великих масивів даних, оскільки в такому випадку апостеріорна підтримка певної моделі може видаватися надзвичайно переконливою, хоча всі запропоновані моделі фактично є поганим представленням стохастичної системи, що стоїть за спостережуваними даними. Передбачувальні перевірки за межами вибірки можуть виявляти потенційні систематичні відхилення в межах моделі й пропонувати ключ до того, як вдосконалити її структуру або параметризацію.

Цікаво, що нещодавно було запропоновано принципово нові підходи для вибору моделі, що включають контроль якості як невід'ємний крок процесу. ПБО за своєю будовою дозволяє оцінювати розбіжності між спостережуваними даними та передбаченнями моделі по відношенню до вичерпного набору статистик. Ці статистики не обов'язково є такими ж, як ті, що застосовуються в критерії прийняття. Отримувані розподіли розбіжностей застосовувались для вибору моделей, що узгоджуються з багатьма аспектами даних одночасно,^[39] і суперечність моделі виявляється з конфліктних та співзалежних зведених статистик. Інший метод вибору моделі на основі контролю якості залучає ПБО для наближення ефективної кількості параметрів моделі та відхилень передбачуваних апостеріорних розподілів зведених статистик та параметрів.^[40] Потім застосовується інформаційний критерій відхилення^[en] як міра придатності моделі. Також було показано, що моделі, яким віддано перевагу за цим критерієм, можуть конфліктувати з тими, які підтримуються коефіцієнтами Баєса. З цієї причини корисно комбінувати різні методи вибору моделей для отримання правильних висновків.

Перевірки якості є досяжними, й дійсно виконуються в багатьох працях, що ґрунтуються на ПБО, але для деяких задач оцінка впливу пов'язаних із методом параметрів може бути складним завданням. Тим не менш, можна очікувати, що використання ПБО, яке швидко зростає, забезпечить глибше розуміння обмежень та застосовності цього методу.

Загальні ризики статистичного висновування, що загострюються в ПБО

В цьому розділі зроблено огляд ризиків, що, суворо кажучи, не є характерними саме для ПБО, а стосуються так само й інших статистичних методів. Проте гнучкість, яку пропонує ПБО для аналізу дуже складних моделей, робить їхнє обговорення тут дуже доречним.

Апріорний розподіл та діапазони параметрів

Специфікація діапазонів та апріорного розподілу параметрів сильно виграє від попередніх знань про властивості системи. Одним із критичних зауважень було те, що в деяких дослідженнях «діапазони та розподіли параметрів всього лише вгадуються на підставі суб'єктивної думки дослідників»,^[41] що пов'язано із класичними запереченнями баєсових підходів.^[42]

За будь-якого обчислювального методу зазвичай необхідно обмежити досліджувані діапазони параметрів. Ці діапазони параметрів повинні за можливості визначатися на підставі відомих властивостей досліджуваної системи, але для практичних застосувань можуть робити необхідним освічене припущення. Тим не менш, доступні теоретичні результати стосовно об'єктивних апріорних, що можуть наприклад ґрунтуватися на принципі нейтральності^[en] або принципі максимальної ентропії^[en].^[43]^[44] З іншого боку, автоматизовані або напівавтоматизовані методи вибору апріорного розподілу часто видають некоректні густини. Оскільки більшість процедур ПБО вимагають генерування вибірок з апріорного, некоректні апріорні не є безпосередньо застосовними в ПБО.

При виборі апріорного розподілу слід також мати на увазі мету аналізу. В принципі, неінформативні та пласкі апріорні, що підкреслюють наше суб'єктивне незнання про параметри, все ж таки можуть видавати прийнятні оцінки параметрів. Проте коефіцієнти Баєса є дуже чутливими до апріорного розподілу параметрів. Висновки про вибір моделі на підставі коефіцієнтів Баєса можуть виявитися оманливими, якщо не обміркувати ретельно чутливість висновків до вибору апріорних.

Мала кількість моделей

Методи на основі моделей піддавалися критиці через не вичерпне покриття простору гіпотез.^[21] Дійсно, дослідження на основі моделей обертаються навколо невеликої кількості моделей, і з причини високих обчислювальних витрат на оцінку однієї моделі в деяких випадках може бути складно покрити велику частину простору гіпотез.

Верхня межа кількості моделей-кандидатів, що розглядаються, зазвичай встановлюється значними зусиллями, необхідними для визначення моделей та для вибору між багатьма альтернативними варіантами.^[10] Не існує загальноприйнятої процедури побудови моделі саме для ПБО, тому натомість застосовуються досвід та попередні знання.^[11] Хоч надійніша процедура для апріорного вибору моделі та формулювання й була би корисною, універсальної стратегії розробки моделі в статистиці не існує: чутливі характеристики складних систем завжди робитимуть необхідною велику кількість детективної праці та використання експертних знань з предметної області.

Деякі опоненти ПБО стверджують, що оскільки реалістично можуть розглядатися лише декілька моделей, суб'єктивно вибрані та ймовірно всі неправильні, то аналіз ПБО пропонує лише обмежене розуміння.^[21] Проте існує важлива відмінність між ідентифікацією правдоподібної нульової гіпотези, та оцінкою відносної придатності альтернативних гіпотез.^[9] Оскільки в контексті складних моделей вкрай рідко може бути висунуто корисні нульові гіпотези, що є потенційно справедливими, то передбачувальна здатність статистичних моделей як пояснення складних явищ є набагато важливішою за перевірку статистичних нульових гіпотез у цьому контексті. Також для отримування висновків про особливості моделі (наприклад, значень параметрів) та здійснення передбачень є звичним робити усереднення досліджуваних моделей, зважених на підставі їхньої відносної правдоподібності.

Великі набори даних

Великі набори даних можуть утворювати обчислювальне вузьке місце для методів на основі моделей. Було, наприклад, вказано, що в деяких аналізах на основі ПБО частину даних має бути опущено.^[21] Ряд авторів стверджують, що великі набори даних не становлять практичного обмеження,^[10]^[42] хоча суворість цієї проблеми сильно залежить від характеристик моделей. Деякі аспекти задачі моделювання, такі як розмір вибірки, кількість спостережуваних змінних або властивостей, часова або просторова роздільна здатність тощо, можуть сприяти обчислювальній складності. Проте зі збільшенням обчислювальних потужностей ця проблема потенційно ставатиме менш важливою.

Замість вибирання параметрів для кожної симуляції з апріорного, як альтернативу було запропоновано поєднувати з ПБО алгоритм Метрополіса — Гастінгса, що, як було повідомлено, дає вищий темп прийняття, ніж чисте ПБО.^[33] Природно, такий підхід успадковує загальні обтяження методів МКМЛ, такі як складність оцінювання збіжності, кореляцію серед вибірок з апостеріорного^[23] та відносно слабку розпаралелюваність.^[10]

Так само для середовища ПБО було адаптовано послідовний^[en] (англ. sequential Monte Carlo, SMC) та сукупнісний (англ. population Monte Carlo, PMC) методи Монте-Карло.^[23]^[45] Загальна ідея полягає в ітеративному підході до апостеріорного з апріорного через послідовність цільових розподілів. Перевагою таких методів у порівнянні з ПБО-МКМЛ є те, що вибірки з отримуваного в результаті апостеріорного є незалежними. На додачу, послідовні методи не вимагають вказання рівнів допуску до початку аналізу, вони регулюються адаптивно.^[46]

Розпаралелювання ряду кроків алгоритмів ПБО на основі відхилювальної вибірки та послідовних методів Монте-Карло^[en] є відносно простим. Також було продемонстровано, що паралельні алгоритми можуть привносити суттєве прискорення до висновування на основі МКМЛ у філогенетиці,^[47] і вони можуть бути придатним підходом також і для методів на основі ПБО. Крім того, адекватна модель складної системи, швидше за все, вимагатиме інтенсивних обчислень не залежно від обраного методу висновування, і це користувачеві обирати метод, що буде придатним для певного застосування, що розглядається.

Прокляття розмірності

Для отримання прийнятного рівня точності висновування апостеріорного набори даних високої розмірності та простори параметрів високої розмірності можуть вимагати симуляції в дослідженні на основі ПБО надзвичайно великої кількості точок параметрів. В таких ситуаціях обчислювальні витрати сильно зростають, і здатні в найгіршому випадку зробити обчислювальний аналіз непіддатливим. Вони є прикладами добре відомих явищ, що позначають узагальнювальним терміном «прокляття розмірності».^[48]

Для оцінки того, наскільки серйозно розмірність даних впливає на аналіз у контексті ПБО, було виведено аналітичні формули помилки оцінювачів ПБО як функції від розмірності зведеної статистики.^[49]^[50] Крім того, Блум (англ. Blum) та Франсуа (англ. François) дослідили, як розмірність зведеної статистики пов'язана із середньоквадратичною помилкою для різних коригувань помилки оцінювачів ПБО. Було також відзначено, що методики зменшення розмірності є корисними для уникання прокляття розмірності через те, що базова структура зведеної статистики потенційно має меншу розмірність.^[49] Керуючись мінімізацією квадратичних втрат оцінювачів ПБО, Фіернхед (англ. Fearnhead) та Пренгл (англ. Prangle) запропонували схему проектування даних (можливо, великої розмірності) на оцінки апостеріорних середніх значень параметрів; цей засіб, що тепер має ту ж розмірність, що й параметри, потім використовується як зведена статистика для ПБО.^[50]

ПБО може застосовуватися для задач висновування в параметричних просторах високої розмірності, хоча слід брати до уваги можливість перенавчання (наприклад, див. методи вибору моделі в^[39] та^[40]). Тим не менш, імовірність прийняття симульованих значень параметрів за заданого допуску в алгоритмі відхилення ПБО, як правило, зменшується експоненційно зі збільшенням розмірності простору параметрів (через глобальний критерій прийняття).^[11] Хоча жоден обчислювальний метод (чи то на основі ПБО, чи ні) не видається здатним до подолання прокляття розмірності, нещодавно було розроблено методи, щоби впоруватися з просторами параметрів високої розмірності за певних припущень (наприклад, на основі поліноміального наближення розріджених ґраток,^[51] що потенційно може сильно зменшувати час симуляції для ПБО). Тим не менше, застосовність цих методів залежить від задачі, і недооцінювати складність дослідження простору параметрів у загальному випадку не можна. Наприклад, введення детерміністського глобального оцінювання параметрів призвело до повідомлень, що глобальні оптимуми, отримані в декількох попередніх дослідженнях задач низької розмірності, були неправильними.^[52] Тому для деяких задач може бути складно зрозуміти, чи є неправильною модель, як обговорювалося вище, чи досліджена область простору параметрів є невідповідною.^[21] Прагматичнішим підходом може бути скорочення масштабів задачі шляхом скорочення моделі.^[11]

Програмне забезпечення

Узагальнити

Перспектива

В даний час доступний ряд програмних пакетів для застосування ПБО до певних класів статистичних моделей. В таблиці 3 представлено добірку програмного забезпечення на основі ПБО.

Більше інформації Програма, Ключові слова та властивості ...

Таблиця 3: Програмне забезпечення, що включає ПБО
Програма	Ключові слова та властивості	Посилання
DIY-ABC	Програма для підгонки генетичних даних до складних ситуацій. Порівняння моделей-конкурентів. Оцінювання параметрів. Обчислення мір відхилення та точності для заданої моделі та відомих значень параметрів.	^[53]
abc R package	Декілька алгоритмів ПБО для виконання оцінки параметрів та вибору моделі. Методи нелінійної гетероскедастичної регресії для ПБО. Інструмент перехресної перевірки.	^[54]^[55]
EasyABC R package	Декілька алгоритмів для виконання ефективних схем вибірки ПБО, включно з 4 послідовними схемами вибірки та 3 схемами МКМЛ.	^[56]^[57]
ABC-SysBio	Пакет Python. Отримування висновків про параметри та обирання моделі для динамічних систем. Поєднує вибірку ПБО з відхиленням, ПМК^[en] ПБО для отримування висновків про параметри та ПМК ПБО для вибору моделі. Сумісний з моделями, написаним мовою Systems Biology Markup Language^[en] (SBML). Детерміновані та стохастичні моделі.	^[58]
ABCtoolbox	Відкрита програма з багатьма алгоритмами ПБО, включно з вибіркою з відхиленням, МКМЛ без правдоподібності, вибіркою на базі частинок та ЗЛМ-ПБО. Сумісність з багатьма програмами симуляції та обчислення зведених статистик.	^[59]
msBayes	Відкритий програмний пакет, що складається з кількох програм C та R, що запускаються інтерфейсною програмою Perl. Ієрархічні зрощені моделі. Дані популяційної генетики з кількох співрозповсюджених видів.	^[60]
PopABC	Програмний пакет для отримування висновків про схему демографічної розбіжності. Зрощена симуляція. Баєсове обирання моделі.	^[61]
ONeSAMP	Вебпрограма для оцінки ефективного розміру популяції з вибірки мікросателітних генотипів. Оцінки ефективного розміру популяції, разом з 95-відсотковими ймовірними інтервалами.	^[62]
ABC4F	Програмне забезпечення для оцінки F-статистики^[en] для домінантних даних.	^[63]
2BAD	2-подійна баєсова домішка^[en] (Bayesian ADmixture). Програмне забезпечення, що підтримує до двох незалежних подій домішки й до трьох батьківських популяцій. Оцінка декількох параметрів (домішка, ефективні розміри тощо). Порівняння пар домішкових моделей.	^[64]

Закрити

Придатність окремих програмних пакетів залежить від конкретних програм, що є в розпорядженні, комп'ютерного середовища, та потрібних алгоритмів.

Див. також

Методи Монте-Карло марковських ланцюгів
Послідовний метод Монте-Карло^[en]
Емпіричний баєсів метод^[en]

Примітки

Loading content...

Посилання

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.