人類滾開！AlphaGoZero太可怕，「自學3天」就以100:0把舊版AlphaGo幹掉！

2017-10-20

人類滾開！AlphaGo Zero太可怕，「自學3天」就以100:0把舊版Alpha Go幹掉！

去年時，DeepMind公司創造的AlphaGo擊敗南韓棋王李世乭；今年5月，AlphaGo Master又以3：0的絕對優勢戰勝圍棋世界冠軍柯潔。幾次勝利下來，人工智慧的發展讓全世界的人都震撼了。我們本以為這就是AlphaGo的巔峰，沒想到Google旗下的AI實驗室又有了新動作，他們帶來了更強大的AlphaGo Zero，曾經打敗人類旗手的版本在它面前簡直不堪一擊。

之前的圍棋大師AlphaGo學習時，需要依靠人類事前輸入大量資料，幫忙訓練技能。但AlphaGo Zero依靠自學就能做到。人類只要輸入基本的圍棋規則，它就能自行下棋，記錄每次的勝負決策、不斷學習。因為沒有人類的經驗和成規束縛，它的成長速度反而更快，弈棋策略更加厲害。

▼DeepMind公司在《自然》科學期刊上發表了一篇名為「不需要人類知識就稱霸圍棋」（Mastering the game of Go without human knowledge）的學術論文，展示了AlphaGo Zero在全球最困難的棋藝競技中，不靠任何人類知識，自我學習成為高手的過程。

▼它只花3天時間，就贏了曾經打敗李世乭的AlphaGo版本，成績還是碾壓式的100：0。學習21天後，它又贏了曾經打敗柯潔的AlphaGo Master版本。短短40天，它就完成了2900萬次的對戰學習。與過去最強的AlphaGo對弈，它的勝率高達90%，成為了至今最優秀的版本，也是當之無愧的「世界最強圍棋選手」。