網站首頁 母嬰 愛美 健康保健 生活 熱點資訊 十二星座
當前位置:瑞麗谷 > 熱點話題 > 百姓民生

我抱着必勝的信念!|柯潔“約戰”AlphaGo

欄目: 百姓民生 / 發佈於: / 人氣:2.63W

“雖然AlphaGo給我們帶來了極大的震撼,但也不是不可戰勝的。我抱着必勝的信念而來,絕不會說人機大戰勝負無所謂這樣的話,我會全力以赴,爭取打破AlphaGo的不敗戰績!”4月10日,20歲的圍棋天才,被認爲當今全球人類圍棋第一人的柯潔九段在新聞發佈會上說。

柯潔“約戰”AlphaGo:我抱着必勝的信念!

柯潔(右一)。

4月10日,中國圍棋協會與浙江省體育局共同舉辦新聞發佈會宣佈,5月23日至27日將在烏鎮舉辦“中國烏鎮·圍棋峯會”。屆時AlphaGo將與中國頂尖棋手以及來自人工智能界的專家齊聚一堂,共同探索圍棋與人工智能背後的深遠奧祕。

一年前,世人共同見證了人工智能領域的一個重大里程碑: AlphaGo戰勝了傳奇圍棋選手李世石。

事實上,人工智能的加入並沒有像一些人所擔心的那樣使這項遊戲式微,反而讓人類棋手變得更加強大而富有創造力。儘管圍棋可能是歷史上被研究、推敲得最爲透徹的一項遊戲,許多職業棋手以及業餘愛好者仍然是通過對AlphaGo創新着法的深入研究,學到了嶄新的知識和策略。

“AlphaGo下棋讓人感覺更自由一些,沒有什麼着法是完全不能下的。現在大家都更多地在嘗試以前沒有下過的一些下法。”周睿羊九段曾表示。

柯潔“約戰”AlphaGo:我抱着必勝的信念! 第2張

圖爲:柯潔(最右)與聶衛平(右二),樊麾(站立者)和古力(最左)於去年在北京聶衛平圍棋道場,憑記憶覆盤 AlphaGo與李世石第一局的開局。

此次“中國烏鎮·圍棋峯會”旨在通過頂尖人類棋手與極具創造性的人工智能對手之間的合作,使人們得到關於圍棋和人工智能的更多新啓示。

據主辦方介紹,此次峯會特別設計了AlphaGo與中國頂尖棋手的三種比賽形式,具體包括:首先,人機配對賽:中國職業棋手將與另一名職業棋手對弈。每一方棋手都將有AlphaGo作爲自己的隊友與他們交替落子,真正體現共同學習的真諦。

其次,團隊賽:由五位中國頂尖棋手組隊與 AlphaGo進行對弈,共同測試 AlphaGo在面對組合風格時所展現的創造力和適應性。

第三,柯潔對陣 AlphaGo:AlphaGo 與世界排名第一的棋手柯潔進行的三番棋對弈將成爲萬衆所矚目的焦點。柯潔會將 AlphaGo的能力推向甚至超越極限。

柯潔是金立智能手機的品牌文化大使。金立認爲,圍棋,並不在於計較一子一目的得失,更需要放眼全局的取捨和戰略,是一種長距離的“超級續航”般的較量。圍棋表達了一種靜默的思考,充滿了寵辱不驚的氣度,是人類智慧的傑作。圍棋人工智能的最高水平與人類最高水平之間的對決,比賽本身的意義就已非同凡響。人工智能代表着科技的未來,也是人類的未來,人機之戰,是人類智慧的延伸,是人類對極限、對未來的一次勇敢探索。金立支持柯潔勇戰AlphaGo。

除動人心魄的比賽之外,峯會還將舉辦一場有關人工智能未來的論壇。來自人工智能的頂尖專家將共同探索AlphaGo如何爲圍棋這項古老的遊戲帶來了全新的認知,並進一步探討人工智能與機器學習是如何幫助人類爲世界上一些重大難題帶來解決方案。

據介紹,AlphaGo背後的部分機器學習方法已經被應用到實際生活中,並在一些重大問題中發揮了作用,比如減少能源使用。機器學習技術也已經開始應用於一系列醫療研究項目中。

延伸閱讀

AlphaGo是什麼?

AlphaGo 是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的電子計算機程序,是圍棋史上最具實力的選手之一。2016 年 3 月,在全世界超過一億觀衆的關注下,AlphaGo經過5局對弈,最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石,這場比賽成爲了人工智能領域的一個重要里程碑。過去曾有專家預測,人工智能需要十年的時間纔可能戰勝人類職業選手,在這場比賽後,AlphaGo憑藉其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成爲歷史上首個獲得這一榮譽的非人類棋手。 近期,AlphaGo的升級版本以"Master / Magister"的稱謂與世界頂級的圍棋選手進行了60場線上快棋賽,並取得了全勝的出色戰績。

 AlphaGo如何訓練?

一直以來,圍棋就被認爲是傳統遊戲中,對人工智能而言最具挑戰性的項目。這不僅是因爲圍棋包含了龐大的搜索空間,更是因爲對於落子位置的評估難度已遠遠超過了簡單的啓發式算法。 爲應對圍棋的複雜性,AlphaGo採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作爲輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網絡自身都十分強大,而 AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,爲下一代版本提供了訓練數據,此過程循環往復。

AlphaGo 如何決定落子?

在獲取棋局信息後,AlphaGo 會根據策略網絡(policy network)探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成爲 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

柯潔“約戰”AlphaGo:我抱着必勝的信念! 第3張