Loading AI tools
З Вікіпедії, вільної енциклопедії
У теорії ймовірностей та статистиці Теоре́ма Ба́єса (або ж Зако́н Ба́єса, чи Правило Баєса) описує ймовірність події, спираючись на обставини, що могли би бути пов'язані з цією подією. Наприклад, припустімо, що хтось цікавиться, чи має рак певна особа, і знає вік цієї особи. Якщо рак пов'язаний з віком, то, застосовуючи теорему Баєса, інформацію про вік осіб можливо використати для точнішої оцінки ймовірності того, що вони мають рак.
При застосуванні задіяні у теоремі Баєса ймовірності можуть мати різні інтерпретації. В одній із цих інтерпретацій теорема Баєса використовується безпосередньо у певному підході до статистичного висновування. При баєсовій інтерпретації ймовірності ця теорема виражає, як повинна раціонально змінюватися суб'єктивна міра впевненості при врахуванні свідчення: це є баєсовим висновуванням, що є фундаментальним для баєсової статистики. Тим не менш, теорема Баєса має численні застосування у широкому спектрі обчислень із залученням ймовірностей, а не лише у баєсовому висновуванні.
Теорему Баєса названо на честь прп. Томаса Баєса ([ˈbeɪz]; 1701—1761), який першим[1] запропонував рівняння, яке дозволяє новим свідченням уточнювати переконання. Її було розвинуто далі П'єром-Симоном Лапласом, який вперше опублікував це сучасне формулювання у своїй праці 1812 року «Аналітична теорія ймовірностей». Сер Гарольд Джеффріс поклав баєсів алгоритм та лапласове формулювання на аксіоматичну основу. Джеффріс писав, що теорема Баєса «є для теорії ймовірностей тим, чим теорема Піфагора є для геометрії».[2]
Теорема Баєса задається математично таким рівнянням:[3]
де та є подіями.
Припустимо, що ми хочемо знати ймовірність того, що якась особа має рак, але ми нічого не знаємо про неї. Незважаючи на відсутність жодних відомостей про особу, якусь імовірність може бути призначено на основі загальної поширеності раку. Заради цього прикладу уявімо, що нею є 1%. Це є відомим як базовий рівень, або апріорна ймовірність мати рак. «Апріорна» відповідає часу до того моменту, як нас буде поінформовано про даний конкретний випадок.
Далі, уявімо, що ми з'ясували, що тій особі 65 років. Якщо припустити, що рак та вік є пов'язаними, то цю нову порцію інформації можна використати для кращої оцінки ризику тієї особи мати рак. Точніше, ми хотіли би знати ймовірність того, що особа має рак, якщо відомо, що їй 65 років. Ця величина є відомою як поточна ймовірність, де «поточна» відповідає теоретичній ситуації після з'ясування інформації про даний конкретний випадок.
Для того, щоби застосувати знання про вік тієї особи в поєднанні з теоремою Баєса, потрібні дві додаткові порції інформації. Зауважте, проте, що ця додаткова інформація не стосується конкретно тієї особи. Потрібна така інформація:
Знаючи це, разом із базовим рівнем, ми можемо обчислити, що особа, яка має вік 65 років, має ймовірність мати рак, що дорівнює
Може стати несподіванкою, що хоча перебування у віці 65 років і збільшує ризик мати рак, ймовірність тієї особи мати рак однаково є досить низькою. Це тому, що низьким є базовий рівень раку (незалежно від віку). Це показує як важливість базового рівня, так і те, що ним зазвичай нехтують.[4] Нехтування базовим рівнем призводить до серйозного спотворення інтерпретації статистики; отже, потрібно приділяти особливу увагу тому, щоб уникати таких помилок. Знайомство з теоремою Баєса є одним із шляхів боротьби з природною схильністю нехтувати базовими рівнями.
Задачі із застосуванням теореми Баєса часто легше зрозуміти, застосовуючи задані в задачі умови до великого набору спостережень. Припустімо, наприклад, що якась спільнота складається зі 100 000 людей. Відповідно до умови задачі, 1% цієї генеральної сукупності, або 1 000 людей, матимуть рак. 0,2% від цієї генеральної сукупності, або 200 людей, матимуть вік 65 років. Із 1 000 людей з раком лише 0,5%, або 5 людей, будуть 65-річними. Таким чином, очікується, що з 200 людей, які мають вік 65 років, лише 5 матимуть рак. 5/200 = 2,5%.
Припустімо, що тест на вживання наркотиків має чутливість 99% та специфічність 99%. Тобто, цей тест даватиме 99% правильних позитивних результатів для тих, хто вживає наркотики, і 99% правильних негативних результатів для тих, хто не вживає. Припустімо, що 0,5% людей вживають наркотики. Якщо для випадково вибраної особи перевірка виявляється позитивною, то якою є ймовірність, що вона вживає наркотики?
Знаменник має таку форму відповідно до Формули повної ймовірності. У даному разі це означає, що ймовірність отримати «чорну мітку» складається із суми двох імовірностей: бути виявленим, якщо ти вживаєш (тут має значення чутливість), і бути «виявленим», хоч ти і «чистий» (а тут — специфічність).
Незважаючи на видиму точність перевірки, все ж якщо індивідуальна перевірка особи дає позитивний результат, то ймовірніше, що ця особа не вживає наркотиків, ніж що вона їх вживає. Це ще раз свідчить про важливість базових рівнів, і як формування політики може бути кричуще помилковим, якщо базовими рівнями нехтують.
Цей несподіваний результат виникає тому, що кількість тих, хто не вживає, є дуже великою у порівнянні з кількістю тих, хто вживає; таким чином, кількість хибних позитивних результатів (0,995%) переважує кількість правильних позитивних результатів (0,495%). На конкретних цифрах, якщо перевірено 1000 осіб, то очікується 995 тих, хто не вживає наркотиків, і 5 тих, хто вживає. Із 995 тих, хто не вживає, очікується 0,01 × 995 ≃ 10 хибних позитивних результатів. Із 5 тих, хто вживає, очікується 0,99 × 5 ≃ 5 правильних позитивних результатів. Із 15 позитивних результатів лише 5, близько 33%, є істинними.
Примітка: Важливість специфічності може бути проілюстровано показуванням, що навіть якщо чутливість є 100%, а специфічність є 99%, то ймовірність того, що особа вживає наркотики, є ≈33%, але якщо специфічність змінюється до 99,5%, а чутливість падає до 99%, то ймовірність того, що особа вживає наркотики, виростає до 49,8%.
Вся продукція заводу виробляється на трьох верстатах. На ці три верстати приходяться 20%, 30% та 50% продукції відповідно. Частка бракованих виробів є такою: 5% для першого верстата, 3% для другого верстата та 1% для третього. Якщо виріб, вибраний навмання із загального обсягу продукції, виявився бракованим, то якою є ймовірність того, що його було зроблено на третьому верстаті?
Розв'язання є таким. Нехай позначає подію, що випадково вибраний виріб було зроблено на -тому верстаті (для ). Нехай позначає подію, що випадково вибраний виріб є бракованим. Тоді ми маємо наступну інформацію:
Якщо виріб було зроблено на верстаті , то ймовірністю його бракованості є 0,05, тобто . Загалом ми маємо
Для отримання відповіді на початкове запитання ми спочатку знаходимо . Це можна зробити наступним чином:
Отже, 2,4% загального обсягу продукції заводу є бракованими.
Нам задано, що сталося, і ми хочемо обчислити умовну ймовірність . За теоремою Баєса
За умови бракованості виробу ймовірністю того, що його виготовили на третьому верстаті, є лише 5/24. Незважаючи на те, що верстат 3 виробляє половину загального обсягу продукції, він видає значно меншу частку бракованих виробів. Тому знання того, що вибраний виріб є бракованим, дозволяє нам замінити апріорну ймовірність меншою апостеріорною ймовірністю .
Знову ж таки, цієї відповіді можна досягнути без вдавання до формули, шляхом застосування умов до будь-якого гіпотетичного числа випадків. Наприклад, у 100 000 виробах, вироблених заводом, 20 000 буде вироблено верстатом A, 30 000 — верстатом B, і 50 000 — верстатом C. Верстат A виробить 1 000 бракованих виробів, верстат B — 900, а верстат C — 500. Із загального числа 2 400 бракованих виробів лише 500, або 5/24, буде вироблено верстатом C.
Інтерпретація теореми Баєса залежить від інтерпретацій імовірності, що приписуються її членам. Нижче описано дві головні інтерпретації.
У баєсовій (або епістемологічній) інтерпретації ймовірність вимірює міру впевненості. Теорема Баєса, таким чином, пов'язує міру впевненості у висловленні до та після врахування свідчення. Наприклад, припустімо, що вважається із впевненістю 50%, що монета вдвічі ймовірніше падає гербом, ніж номіналом. Якщо монету підкидають кілька разів та спостерігають результати, то міра впевненості може рости, зменшуватися чи залишатися незмінною залежно від результатів.
Для висловлення та свідчення
Для подальшої інформації про застосування теореми Баєса при баєсовій інтерпретації ймовірності див. баєсове висновування.
У частотницькій інтерпретації ймовірність вимірює частку результатів. Наприклад, припустімо, що експеримент проводиться багато разів. є часткою результатів із властивістю , а — із властивістю . є часткою результатів із властивістю серед результатів із властивістю , а — часткою тих, що з серед тих, що з .
Роль теореми Баєса найкраще візуалізується за допомогою деревоподібних схем, як показано праворуч. Ці дві діаграми розділюють одні й ті самі результати за та у протилежному порядку, для отримання зворотних ймовірностей. Теорема Баєса слугує зв'язком між цими двома розділюваннями.
Ентомолог спостерігає за, можливо, рідкісним підвидом жука, оскільки у жука є візерунок на спині. Відомо, що 98 % жуків з рідкісного підвиду мають цей візерунок, або, формально, P(Візерунок|Рідкісний) = 98 %. У поширеного підвиду цей візерунок мають 5 % створінь. Рідкісний підвид налічує лише 0,1 % від популяції двох видів. Наскільки ймовірно, що жук з візерунком, за яким спостерігає ентомолог, є рідкісним? Тобто, чому дорівнює P(Рідкісний|Візерунок)?
Скористаємося розширеною формою теореми Баєса (оскільки будь-який жук популяції може бути лише рідкісним або поширеним):
Тобто, ймовірність того, що ентомолог спостерігає саме рідкісний підвид жука — незначна, а саме 1,9 % або 0,019.
Для подій та , за умови, що ,
У багатьох застосуваннях, наприклад, у баєсовому висновуванні, подія під час розгляду є фіксованою, і ми хочемо розглядати вплив того, що трапилося її спостереження, на нашу впевненість у різних можливих подіях . У такій ситуації знаменник крайнього виразу, ймовірність заданого свідчення , є фіксованим, а варіювати ми хочемо . Тоді теорема Баєса показує, що апостеріорні ймовірності є пропорційними до чисельника:
Словами: апостеріорне пропорційне апріорній кількості разів правдоподібності.[5]
Якщо події є взаємовиключними та вичерпними, тобто, одна з них точно відбувається, але жодні дві не можуть відбуватися одночасно, і ми знаємо їхні ймовірності з точністю до пропорційності, то ми можемо визначити коефіцієнт пропорційності, використовуючи той факт, що їхні ймовірності повинні давати в сумі одиницю. Наприклад, для заданої події сама подія та її доповнення є взаємовиключними та вичерпними. При позначенні коефіцієнту пропорційності через ми маємо
Шляхом додавання цих двох формул ми виводимо
Іншою формою теореми Баєса, що звичайно зустрічається при розгляді двох конкурентних тверджень або гіпотез, є
Для епістемологічної інтерпретації:
Для висловлення та свідчення або передумови ,[6]
Часто для деякого розбиття простору вибірки цей простір подій задається або умоглядно представляється у термінах та . У такому випадку зручно обчислювати із використанням закону повної ймовірності:
В окремому випадку, коли є двійковою змінною[en]:
Розгляньмо простір подій , породжуваний двома випадковими змінними та . В принципі, теорема Баєса застосовується до подій та . Однак, члени стають нульовими у точках, де будь-яка зі змінних має скінченну густину імовірності. Щоби теорема Баєса залишалася придатною, її може бути сформульовано у термінах доречних густин (див. Виведення).
Якщо є безперервною, а — дискретною,
Якщо є дискретною, а — безперервною,
Якщо як , так і є безперервними,
Безперервний простір подій часто представляється у термінах чисельників. Часто зручно виключати знаменник, використовуючи закон повної ймовірності. Для це стає інтегралом
Правило Баєса — це теорема Баєса у формі шансів[en].
де
називається коефіцієнтом Баєса, або відношенням правдоподібності, і шанси між двома подіями є просто відношенням ймовірностей цих двох подій. Отже,
Таким чином, це правило говорить, що апостеріорні шанси є апріорними шансами, помноженими на коефіцієнт Баєса, або, іншими словами, апостеріорне пропорційне апріорній кількості разів правдоподібності.
Теорему Баєса може бути виведено з визначення умовної ймовірності:
Для двох безперервних випадкових змінних та теорему Баєса може бути виведено аналогічно з визначення умовної густини:
Теорему Баєса названо на честь преподобного Томаса Баєса (1701—1761), який вивчав, як обчислювати розподіл для параметру ймовірності біноміального розподілу (у сучасній термінології). Неопублікований рукопис Баєса було суттєво відредаговано Річардом Прайсом[en] до того, як його було посмертно прочитано в Королівському товаристві. Прайс відредагував[7] головну працю Баєса, «Есе щодо розв'язання задачі у Доктрині шансів[en]» (1763), що з'явилася в журналі Philosophical Transactions, і містить теорему Баєса. Прайс написав передмову до цієї праці, що подає дещо з філософських основ баєсової статистики. У 1765 році його було обрано Членом Королівського товариства, на визнання його праці над спадком Баєса.[8][9]
Французький математик П'єр-Симон Лаплас відтворив та узагальнив результати Баєса у 1774 році, очевидно, не підозрюючи про працю Баєса.[10][11] Стівен Стіглер[en] у 1983 році висловив думку, що теорему Баєса було відкрито Ніколасом Сондерсоном[en] за деякий час до Баєса.[12] Проте ця інтерпретація була спірною.[13]
Мартін Купер[14] та Шарон Мак-Грейн[15] стверджують, що внесок Річарда Прайса[en] був істотним:
За сучасними стандартами ми повинні посилатися на правило Баєса — Прайса. Прайс відкрив працю Баєса, усвідомив її важливість, виправив її, вніс до статті, та знайшов їй застосування. Сучасний звичай використовувати саме лише ім'я Баєса є несправедливим, але він настільки вкорінився, що все інше має мало сенсу.[15] Оригінальний текст (англ.) By modern standards, we should refer to the Bayes–Price rule. Price discovered Bayes's work, recognized its importance, corrected it, contributed to the article, and found a use for it. The modern convention of employing Bayes's name alone is unfair but so entrenched that anything else makes little sense. |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.