Loading AI tools
ситуація, за якої одна зі стратегій гравця краща, ніж інша, за будь-яких дій опонентів З Вікіпедії, вільної енциклопедії
Домінування в теорії ігор — ситуація, за якої одна зі стратегій деякого гравця дає більший виграш, ніж інша, за будь-яких дій його опонентів. Зворотне поняття, нетранзитивність, виникає, якщо деяка стратегія може давати менші виграші, ніж інша, залежно від поведінки інших учасників.
Поняття домінування використовується при вирішенні або спрощенні деяких типів некооперативних ігор.
При виборі стратегії з безлічі допустимих гравець порівнює по результати від їх застосування. Може виникати три типи результатів:
Це поняття узагальнюється на порівняння більш ніж двох стратегій:
Кажуть, що стратегія гравця слабко домінує стратегію , якщо
тут є прямим добутком стратегічних множин усіх гравців, окрім -го.
Стратегія строго домінує , якщо
C | D | |
---|---|---|
C | 1 ; 1 | 0 ; 0 |
D | 0 ; 0 | 0 ; 0 |
Слабке домінування |
Якщо для одного з гравців існує строго домінівна стратегія, він буде її використовувати в будь-якій з рівноваг Неша в грі. Якщо всі гравці мають строго домінівні стратегії, гра має єдину рівновагу Неша. Однак ця рівновага не обов'язково буде ефективною за Парето, тобто нерівноважні результати можуть забезпечити всім гравцям більший виграш. Класичним прикладом цієї ситуації є гра «Дилема в'язня».
Використання строго домінованих стратегій ні за яких умов не є раціональним для гравців, тому вони не будуть входити в рівноваги Неша. Разом з тим, слабко доміновані стратегії можуть входити в рівноваги. Приклад такої гри наведено праворуч.
Тут стратегії D обох гравців слабко домінуються їхніми стратегіями C. Однак ситуація (D, D) є рівновагою Неша в цій грі. Дійсно, жоден з гравців, відхиляючись від використання D, не зможе отримати більшого виграшу, якщо інший гравець дотримується D.
Послідовне виключення домінованих стратегій — часто використовувана технологія вирішення або спрощення некооперативних ігор. Вона заснована на припущенні про те, що в процесі гри сторони не будуть використовувати домінованих стратегій, тому їх можна не розглядати при подальшому вирішенні. Однак виключення цих стратегій з розгляду призводить до звуження багатьох можливих ситуацій, внаслідок чого можуть виникнути нові доміновані стратегії, які у початковій грі не домінувалися. Послідовне виключення домінованих стратегій полягає в їх знаходженні і видаленні в послідовності редукованих ігор зі звужуваними множинами ігрових ситуацій.
Цей процес може зупинятися, приводячи до редукованої гри, в якій усі стратегії гравців є нетранзитивними або до єдиної ситуації. Якщо при цьому видалялися строго доміновані стратегії, така ситуація є єдиною рівновагою Неша в грі. Видалення слабко домінованих стратегій також приводить до рівноваги Неша, проте ця рівновага може бути не єдиною. У деяких іграх, залежно від послідовності видалення слабко домінованих стратегій, процес ітеративного виключення може збігатися до різних рівноваг Неша.
Приклад вирішення гри методом послідовного виключення строго домінованих стратегій[1].
Нехай у грі беруть участь гравці A і B. Для гравця A доступні стратегії a1 і a2, для гравця B — стратегії b1, b2, b3. Гравці вибирають стратегії одночасно і незалежно один від одного. У таблиці наведено платежі, які отримують гравці, зігравши свою стратегію, залежно від вибраної стратегії іншого гравця. Перша цифра в комірці — платіж першого гравця, цифра після крапки з комою — платіж, отриманий другим гравцем.
Початкова таблиця. Наприклад, з таблиці видно, що якщо гравець A зіграє стратегію a2, а гравець B зіграє стратегію b3, то гравець A отримає 4 очка, а гравець B — 1 очко.
b 1 | b 2 | b 3 | |
---|---|---|---|
a 1 | 6 ; 5 | 3 ; 6 | 3 ; 9 |
a 2 | 7 ; 7 | 3 ; 0 | 4 ; 1 |
Можна помітити, що незалежно від вибору гравця A, для другого гравця стратегія b2 поступається за своїми характеристиками стратегії b3 (6 < 9 і 0 < 1).
b 1 | b 2 | b 3 | |
---|---|---|---|
a 1 | 6 ; 5 | 3 ; 6 | 3 ; 9 |
a 2 | 7 ; 7 | 3 ; 0 | 4 ; 1 |
Тому стовпець зі стратегією b2 можна не враховувати в подальшому розгляді, викреслюємо його. З точки зору гравця A, серед решти стратегій, a1 явно поступається a2 (6 < 7 і 3 < 4)
b 1 | b 3 | |
---|---|---|
a 1 | 6 ; 5 | 3 ; 9 |
a 2 | 7 ; 7 | 4 ; 1 |
Викреслюємо рядок зі стратегією a1. У таблиці платежів залишається всього дві комірки, і для другого гравця стратегія b1 явно краща від стратегії b3 (1 < 7).
b 1 | b 3 | |
---|---|---|
a 2 | 7 ; 7 | 4 ; 1 |
Таким чином, виключенням строго домінованих стратегій ми вирішили гру: раціональні гравці зіграють стратегії b1 і a2, кожен гравець отримає платіж рівний 7.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.