人類滾開!AlphaGo Zero太可怕,「自學3天」就以100:0把舊版Alpha Go幹掉!
去年時,DeepMind公司創造的AlphaGo擊敗南韓棋王李世乭;今年5月,AlphaGo Master又以3:0的絕對優勢戰勝圍棋世界冠軍柯潔。幾次勝利下來,人工智慧的發展讓全世界的人都震撼了。我們本以為這就是AlphaGo的巔峰,沒想到Google旗下的AI實驗室又有了新動作,他們帶來了更強大的AlphaGo Zero,曾經打敗人類旗手的版本在它面前簡直不堪一擊。
之前的圍棋大師AlphaGo學習時,需要依靠人類事前輸入大量資料,幫忙訓練技能。但AlphaGo Zero依靠自學就能做到。人類只要輸入基本的圍棋規則,它就能自行下棋,記錄每次的勝負決策、不斷學習。因為沒有人類的經驗和成規束縛,它的成長速度反而更快,弈棋策略更加厲害。
▼DeepMind公司在《自然》科學期刊上發表了一篇名為「不需要人類知識就稱霸圍棋」(Mastering the game of Go without human knowledge)的學術論文,展示了AlphaGo Zero在全球最困難的棋藝競技中,不靠任何人類知識,自我學習成為高手的過程。
▼它只花3天時間,就贏了曾經打敗李世乭的AlphaGo版本,成績還是碾壓式的100:0。學習21天後,它又贏了曾經打敗柯潔的AlphaGo Master版本。短短40天,它就完成了2900萬次的對戰學習。與過去最強的AlphaGo對弈,它的勝率高達90%,成為了至今最優秀的版本,也是當之無愧的「世界最強圍棋選手」。
AlphaGo Zero使用的是「強化學習」方法。它將神經網路和演演算法結合,持續自我對弈,練習幾百萬、幾千萬場,每次的更新都能增強、調整系統,用以預測下一步落子的方向和遊戲輸贏走勢。人類積累千年的圍棋智慧,它用幾天時間就全部掌握,還青出於藍而勝於藍。
人工智慧太強大了,讓人忍不住有危機感啊。
來源:QUARTZ