烘焙設備價格烘焙食品機械廠商推薦～糕餅業必看－可可的超值清單

AlphaGo 對李世石“放水”？棋手說不可能！

就在輿論普遍認為李世石將會繼續敗北的時候，人機大戰的第四場，李世石出人意料地挽回瞭勝局，將比分改寫為“3:1”。

比賽開局階段，李世石始終落後於 AlphaGo，一直在被吊打。然而，第78手的時候，局勢峰回路轉，李世石下出瞭關鍵的一步，一招極其冷門下出妙手。對於這一步棋，視頻觀戰的職業棋手古力評價為“神之一手”。

隨後，AlphaGo 一連串的差手讓棋面局勢利好於李世石。在第97步，AlphaGo 再次出現低級失誤，所下白子被李世石果斷吃掉。最終，經過長達4個多小時的鏖戰之後，AlphaGo中盤認輸，李世石終於在這場人機大戰中贏回“尊嚴”之戰。

對於戲劇性的比賽結果，雷鋒網編輯的朋友圈出現瞭有多種觀點看法，其中最有代表性的一種說法是“AlphaGo 選擇性放水“。甚至還有陰謀論表示，AlphaGo 今天失利是因為被改代碼。那麼，AlphaGo 放水的可能性有多大呢？

雷鋒網(公眾號：雷鋒網)第一時間針對這一問題請教瞭圍棋界的專業人士。對此說法，他們都表示，“可能性為零”。至於李世石第78步的落子，完全可以稱得上是載入史冊的一次妙招！

業餘圍棋5段的趙治勛（20年棋齡，並非職業9段棋手的趙治勛）表示：

李世石創造瞭歷史，第78步棋沒有一定水平看都看不懂，很高的職業水準才能想得到。

棋手鮑雲對於李世石第78步下法給予瞭很高的評價：

“配得上最高評價神之一攪拌機比較手。

AlphaGo 程序在大優局面的情況下被李世石的妙手打懵瞭，導致在隨後的20來步進入瘋狗狀態。鮑雲表示：

AlphaGo 前半盤大優，不是防水的態度。至於AlphaGo 第97步的表現可以用“瘋狗病發作”來形容。78-97步，機器應該有足夠的（時間來）緩沖調整計算出局面走勢。97確實是很“丟狗”的一步，說明算法還是有極大的問題，抗擊打能力不足，崩潰的太脆瞭”。

那麼，AlphaGo為何會出現如此明顯的異常表現？

根據Alphago原論文第一作者之一的Demis Hassabis 在賽後的總結，

“李世石下出白78後，AlphaGo自我感台中食品機械覺良好，在程序的“值網絡”(用於評估電腦勝率)中，誤以為勝率達到70%，直到第87步才反應過來。”食品機械台中

趙治勛猜測，很可能是蒙特卡洛算法本身的一個缺陷。“78步本身是盲點，（李世石）小概率的選點，很可能導致（AlphaGo）在正確率很高的算法上出現意外事件，導致出錯。”如果這一猜測成立，人類將可能找到每盤打敗阿爾法的策略。而谷歌公司，將需要很長的時間來修正這一“缺陷”問題。

出門問問ＮＬＰ工程師李理也在微信群給出瞭自己的猜測：

（如果一定要猜測）我覺得可能是開局主要靠valuenetwork，因為搜索空間太大，有可能在某些特殊的局面下出現非常差的結果。就像之前神經網絡識別圖片時也出現過很詭異的錯誤，還有人研究怎麼構造讓它識別出錯的例子。

同時，他也認為這一“詭異”問題將會比較難解決，

神經網絡打分是固定的，搜索有一定隨機性。而value network是異步的，調試也不簡單，得通宵加班找bug瞭。

PS.最新消息補充：

在賽後的記者招待會上，李世石談到瞭AlphaGo的兩個弱點：一個是AlphaGo執黑棋時似乎掙紮比較多，相較執白棋時更難贏。另一個是，當它遇到出其不意的招數時，有可能會導致失誤，未必是失誤，就是bug。

那麼問題來瞭，第5場比賽，各位怎麼看？是李世石再下一城還是AlphaGo 4:1 榮耀收關？

雷鋒網原創文章，未經授權禁止轉載。詳情見轉載須知。

ogk648io28

可可的超值清單

ogk648io28 發表在痞客邦留言(0) 人氣()

可可的超值清單

可可的超值清單

烘焙設備價格烘焙食品機械廠商推薦～糕餅業必看

歷史上的今天

留言列表

站方公告

活動快報

超細纖...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

可可的超值清單

可可的超值清單

烘焙設備價格 烘焙食品機械廠商推薦～糕餅業必看

歷史上的今天

留言列表

站方公告

活動快報

超細纖...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

烘焙設備價格烘焙食品機械廠商推薦～糕餅業必看