Loading AI tools
З Вікіпедії, вільної енциклопедії
Ба́єсова ймові́рність (англ. Bayesian probability) — це одна з інтерпретацій поняття ймовірності. На протилежність до інтерпретування ймовірності як «частоти» або «схильності»[en] певного явища, баєсова ймовірність є величиною, що ми визначаємо з метою представлення стану знання[1] або переконання.[2] З баєсової точки зору ймовірність призначається гіпотезі, тоді як згідно з частотницькою точкою зору гіпотеза зазвичай перевіряється, не маючи призначеної ймовірності.
Баєсову інтерпретацію ймовірності можна розглядати як розширення логіки висловлень, що уможливлює міркування із гіпотезами, тобто судженнями, чиї істинність або хибність є невизначеними.
Баєсова ймовірність належить до категорії доказових імовірностей; для обчислення ймовірності гіпотези фахівець із баєсової статистики встановлює певну апріорну ймовірність, що потім уточнюється у світлі нових, доречних даних (свідчень).[3] Баєсова інтерпретація забезпечує стандартний набір процедур та формул для виконання цього обчислення.
Термін «баєсова» походить від математика та теолога XVIII сторіччя Томаса Баєса, що запропонував перший математичний підхід до нетривіальної задачі баєсового висновування.[4] Математик П'єр-Симон Лаплас започаткував та популяризував те, що тепер називається баєсовою ймовірністю.[5]
Загалом кажучи, існує два погляди на баєсову ймовірність, що інтерпретують поняття ймовірність різним чином. Згідно з об'єктивістським підходом, правила баєсової статистики може бути підтверджено вимогами раціональності та відповідності[en], та інтерпретовано як розширення логіки.[1][6] Згідно з суб'єктивістським підходом, ймовірність визначає «особисте переконання».[2]
Баєсові методи характеризуються такими поняттями та процедурами:
Загалом кажучи, існує два погляди на баєсову ймовірність, що інтерпретують поняття «ймовірність» різним чином. Для об'єктивістів ймовірність об'єктивно вимірює правдоподібність тверджень, тобто, ймовірність твердження відповідає розсудливому переконанню, яке будь-хто (навіть «робот»), хто поділяють однакові знання, повинні поділяти у відповідності з правилами баєсової статистики, що може бути підтверджено вимогами раціональності та відповідності[en].[1][6] Для суб'єктивістів ймовірність відповідає «особистому переконанню».[2] Для суб'єктивістів раціональність та зв'язність обмежують властивості, що міг би мати предмет, дозволяючи істотне коливання в межах цих обмежень. Об'єктивні та суб'єктивні варіанти баєсової ймовірності відрізняються переважно в їхній інтерпретації та в побудові апріорної ймовірності.
Детальніші відомості з цієї теми ви можете знайти в статті Історія статистики § Баєсова статистика[en].
Термін баєсів стосується Томаса Баєса (1702—1761), який довів окремий випадок того, що тепер називається теоремою Баєса, у праці під назвою «Есе щодо розв'язання задачі у Доктрині шансів[en]».[8] У цьому окремому випадку апріорний та апостеріорний розподіли були бета-розподілами, а дані вибиралися з проб Бернуллі. П'єр-Симон Лаплас (1749—1827) впровадив загальну версію цієї теореми та застосовував її для підходу до задач небесної механіки, медичної статистики, надійності[en] та юриспруденції.[9] Раннє баєсове висновування, що використовувало рівномірний апріорний розподіл згідно з лапласовим принципом недостатнього обґрунтування[en], називалося «зворотною ймовірністю[en]» (оскільки воно здійснює зворотне висновування від спостережень до параметрів, або від наслідків до причин[10]). Після 1920-х років «зворотну ймовірність» було значною мірою витіснено набором методів, що стали називати частотницькою статистикою.[10]
У XX столітті ідеї Лапласа отримали подальший розвиток у двох різних напрямках, давши початок об'єктивній та суб'єктивній течіям у баєсовій практиці. «Теорія ймовірності» Гарольда Джеффріса (вперше опублікована 1939 року) відіграла важливу роль у відродженні баєсового погляду на ймовірність, з наступними працями Абрахама Валда (1950) та Леонарда Севіджа[en] (1954). Сам прикметник баєсів сходить до 1950-х років; похідні баєсовизм та нео-баєсовизм викарбувано у 1960-х.[11] В об'єктивістській течії статистичний аналіз залежить лише від прийнятої моделі та аналізованих даних.[12] Потреба в залученні суб'єктивних рішень відсутня. На відміну від цього, «суб'єктивістські» статистики заперечують можливість повністю об'єктивного аналізу в загальному випадку.
У 1980-х роках було різке зростання наукових досліджень та застосувань баєсових методів, що здебільшого стосувалися відкриття методів Монте-Карло марковських ланцюгів, які усунули чимало обчислювальних проблем та посилили зацікавленість у нестандартних, складних застосуваннях.[13] Попри ріст баєсових наукових досліджень, більшість початкового викладання й досі ґрунтується на частотницькій статистиці.[14][джерело?] Тим не менш, баєсові методи є широко визнаними та застосовуваними, наприклад, у галузі машинного навчання.[15]
Використання баєсових ймовірностей як основи для баєсового висновування підтримувалося кількома доведеннями, такими як аксіоми Кокса[en], доведенням голландської системи ставок[en], доведенням на базі теорії рішень та теоремою де Фінетті[en].
Річард Кокс[en] показав,[6] що баєсове уточнення слідує кільком аксіомам, включно з двома функційними рівняннями та спірною гіпотезою диференційовності. Відомо, що розробка Кокса 1961 року (переважно скопійована Джейнсом[en]) не є суворою, і насправді Галперном[en] було знайдено контрприклад.[16] Припущення про диференційовність чи навіть безперервність є сумнівним, оскільки булева алгебра виразів може бути лише скінченною.[7] Щоби зробити цю теорію суворішою, різними авторами було запропоновано інші аксіоматизації.[7]
Доведення голландської системи ставок, що запропонував де Фінетті, базується на парі. Система ставок є голландською[en] тоді, коли вправний гравець укладає такий набір парі, що гарантує вигоду, не залежно від результатів парі. Якщо букмекер у побудові своїх шансів слідує правилам баєсового числення, то голландську систему ставок зробити неможливо.
Проте Ян Хакінг[en] зауважив, що традиційні аргументи голландської системи ставок не визначали використання саме баєсового уточнення: вони залишили відкритою можливість, що не-баєсові правила уточнення можуть обходити голландську систему ставок. Наприклад, Хакінг пише[17], що
Й ані аргумент голландської системи ставок, ані жоден інший в арсеналі доказів ймовірнісних аксіом персоналістів не тягне за собою динамічного припущення. Жоден не тягне за собою баєсовизму. Тому персоналістові потрібно, щоби динамічне припущення було баєсовим. Це є правда, що в послідовності персоналіст може відмовитися від байєсової моделі навчання на досвіді. Сіль може втратити свій смак.
Оригінальний текст (англ.)
And neither the Dutch book argument, nor any other in the personalist arsenal of proofs of the probability axioms, entails the dynamic assumption. Not one entails Bayesianism. So the personalist requires the dynamic assumption to be Bayesian. It is true that in consistency a personalist could abandon the Bayesian model of learning from experience. Salt could lose its savour. |
Насправді, існують не-баєсові правила уточнення, що також обходять голландську систему ставок (як обговорюється в літературі про «кінематику ймовірностей» після публікації правила Річарда Джефрі[en], що й саме розглядається як баєсове[18]). Додаткові гіпотези, достатні для (однозначного) вказання баєсового уточнення, є значними, складними та незадовільними.[19]
Обґрунтування статистичної теорії рішень використання баєсового висновування (і відтак баєсових імовірностей) було запропоновано Абрахамом Валдом, який довів, що кожна прийнятна[en] статистична процедура є або баєсовою процедурою, або границею баєсових процедур.[20] І навпаки, кожна баєсова процедура є прийнятною[en].[21]
Після праці Ремзі та фон Неймана про теорію очікуваної корисності фахівці з теорії рішень пояснили раціональну поведінку із використанням розподілу ймовірності для агента. Йоган Пфанцагль завершив «Теорію ігор та економічної поведінки[en]», запропонувавши аксіоматизацію суб'єктивної ймовірності та корисності — завдання, залишене незавершеним фон Нейманом та Оскаром Морґенштерном: їхня первісна теорія для зручності передбачала, що всі агенти мають однаковий розподіл ймовірностей.[22] Аксіоматизацію Пфанцагля було схвалено Оскаром Морґенштерном: «Фон Нейман та я передбачили» питання, чи ймовірності «могли би, можливо типовіше, бути суб'єктивними, та конкретно заявили, що в останньому випадку може бути знайдено аксіоми, з яких могло би бути виведено бажану числову корисність разом зі значеннями ймовірностей (пор. с. 19 Теорії ігор та економічної поведінки[en]). Ми не довершували це; це було продемонстровано Пфанцаглем… з усією необхідною суворістю».[23]
Ремзі та Севідж[en] зауважили, що розподіли ймовірностей окремих агентів може бути об'єктивно вивчено в експериментах. Роль обґрунтування й незгоди в науці визнавалася починаючи з Аристотеля, і ще ясніше за Френсіса Бекона. Об'єктивність науки полягає не в психології окремих науковців, але в самому процесі науки, та особливо у статистичних методах, як зауважив Ч. Пірс.[24] Нагадуємо, що, об'єктивні методи спростування припущень про особисті ймовірності використовувалися протягом півстоліття, як було зауважено вище. Процедури перевірки гіпотез про ймовірності (з використанням скінченних проб) завдячують Ремзі (1931) та де Фінетті[en] (1931, 1937, 1964, 1970). Як Бруно де Фінетті[en], так і Френк Ремзі визнають[джерело?] свій борг перед прагматичною філософією[en], зокрема (для Ремзі) перед Чарлзом Пірсом.
«Перевірка Ремзі» для оцінювання розподілів ймовірності є теоретично реалізовною, і вона займала експериментальних психологів протягом півстоліття.[25] Ця праця показує, що баєсово-ймовірнісні припущення можливо спростовувати, і отже вони відповідають емпіричному критерієві Чарлза Пірса, чия праця надихнула Ремзі. (Цей критерій спростовності було популяризовано Карлом Поппером.[26][27])
Сучасні праці над експериментальною оцінкою особистих ймовірностей використовують рандомізацію, сліпий метод та процедури булевих рішень експерименту Пірса-Ястрова[en].[28] Оскільки особи діють відповідно до різних оцінок ймовірності, ці ймовірності агентів є «особистими» (проте придатними до об'єктивного вивчення).
Особисті ймовірності є проблематичними для науки та деяких застосувань, у яких ухвалювачам рішень бракує знань або часу для визначення обґрунтованого розподілу ймовірності (на підставі якого вони готуються діяти). Щоби відповідати потребам науки та людським обмеженням, баєсові статистики розробили «об'єктивні» методи визначення апріорних ймовірностей.
Справді, деякі баєсівці стверджують, що апріорний стан знання визначає єдиний (унікальний) апріорний розподіл ймовірності для «звичайних» статистичних задач; пор. з коректно поставленими задачами. Знаходження правильного методу побудови таких «об'єктивних» апріорних (для відповідних класів звичайних задач) було предметом пошуку теоретиків статистики від Лапласа до Джона Кейнса, Гарольда Джеффріса та Едвіна Джейнса[en]: теоретики та їхні послідовники запропонували декілька методів для побудови «об'єктивних» апріорних:
Кожен із цих методів вносить корисні апріорні для «звичайних» однопараметрових задач, і кожне апріорне може впоруватися з декількома складними статистичними моделями (з «нерегулярністю», або з декількома параметрами). Кожен із цих методів був корисним у баєсовій практиці. Справді, методи побудови «об'єктивних» (або ж «стандартних», або «необізнаних») апріорних було розроблено видатними суб'єктивістськими (або «персоналістськими») баєсівцями, такими як Джеймс Бергер[en] (Дюкський університет) та Хосе-Мігель Бернардо[en] (Університет Валенсії), просто тому, що такі апріорні потрібні для баєсового застосування, зокрема в науці.[29] Пошук «універсального методу побудови апріорних» продовжує приваблювати статистичних теоретиків.[29]
Отже, баєсів статистик потребує або використання обґрунтованих апріорних (із застосуванням відповідного досвіду або попередніх даних), або вибору серед конкуруючих методів побудови «об'єктивних» апріорних.
Ба́єсове сере́днє є методом оцінювання середнього значення вибірки згідно з баєсовою інтерпретацією, де замість оцінювання середнього суворо з будь-яких або всіх доступних даних набору до обчислення може також бути включено іншу наявну інформацію, пов'язану із цим набором даних, з метою мінімізації впливу великих відхилень, або для заявлення стандартного значення, якщо набір даних є малим.
Обчислення баєсового середнього включає апріорне середнє m та сталу C. Сталій C встановлюється значення, пропорційне типовому розмірові набору даних. Це значення є більшим, коли очікувані відхилення між наборами даних (у межах більшої вибірки) є малими. Воно є меншим, коли очікується, що набори даних значно різнитимуться один від одного.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.