博弈論中,ε-均衡Epsilon-Equilibrium)是一個近似符合納殊均衡條件的策略組合,有時也稱近似納殊均衡[1][2]

定義

給定一個對策模型和一個非負實參數ε,一個策略組合被稱為ε-均衡,當沒有任何一個局中人能通過單方面改變他的策略而取得超過原先收益(Payoff)更多ε的收益。當ε=0時,每一個ε-均衡對應着一個納殊均衡[3]

從形式上來定義,令以下為N人對策模型[4]

,其中為第個局中人的純策略集,效用函數

當一組策略滿足以下條件時:

,有

則稱這個策略組合為該對策模型的一個ε-均衡。

舉例

ε-均衡的定義在隨機博弈理論中可能出現的無限對策的情況下很重要,因為在一些簡單的隨機博弈的例子中,並沒有納殊均衡點的存在,但有ε-均衡。

參考文獻

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.