Loading AI tools
DeepMind电脑程序 来自维基百科,自由的百科全书
AlphaZero是DeepMind所開發的人工智能軟體[1]。
此條目需要擴充。 (2018年5月8日) |
此條目需要精通或熟悉相关主题的编者参与及协助编辑。 (2018年5月8日) |
AlphaZero使用與AlphaGo Zero類似但更一般性的演算法,在不做太多改變的前提下,並將演算法從圍棋延伸到将棋與國際象棋上。AlphaZero與AlphaGo Zero不同之處在於[1]:
AlphaZero基於蒙特卡洛树搜索,每秒只能搜尋8萬步(西洋棋)與4萬步(將棋),相較於Stockfish每秒可以7000萬步,以及elmo每秒可以3500萬步,AlphaZero則是利用了類神經網路提昇了搜尋的品質[1]。
AlphaZero使用了5,000顆第一代的TPU進行訓練。
在4小時的訓練後(約自我訓練4400萬局[1]:Table S3),AlphaZero以28勝72和0敗的成績打敗Stockfish[1]:Table 1。
在12小時的訓練後(約自我訓練2400萬局[1]:Table S3),AlphaZero以90勝2和8敗的成績打敗elmo[1]:Table 1。
在34小時的訓練後(約自我訓練2100萬局[1]:Table S3),AlphaZero以60勝40敗的成績打敗AlphaGo Zero[1]:Table 1。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.