機器人正在學習用自己的語言相互聊天

欄目: 百姓民生 / 發佈於: / 人氣:3.9K

據《連線》雜誌報道，美國的一個AI團隊正在研究如何讓機器人創造自己的語言，可以互相聊天。以下是原文內容：

伊果爾·麥多奇（Igor Mordatch）正在努力構建可以聊天的機器。這是很多人都在做的事情。畢竟在硅谷，聊天機器人已經成爲了一個流行詞彙。但是麥多奇的做法和他們不同。他不是語言學家。他也不研究語言處理AI技術。他是一個機器人專家，最初是以動畫師的身份出道的。他在皮克斯時參加過《玩具總動員3》的製作，之後又在斯坦福大學和華盛頓大學等學術機構任教，教學生如何讓機器人像人類一樣移動。“我一直都對從零開始創造東西很感興趣，”他說。現在，他所有的這些專業知識都以一種意想不到的方式結合到了一起。

麥多奇現年31歲，出生於烏克蘭，在多倫多長大，現在是OpenAI的客座研究員。OpenAI是由特斯拉創始人馬斯克（Elon Musk）和Y combinator總裁歐特曼（Sam Altman）創辦的一家人工智能實驗室。麥多奇正在探索一條新的道路，讓機器不僅僅能與人交談，還能互相交談。他正在搭建一些需要軟件機器人學會自己創造語言的虛擬世界。

OpenAI本週發表的一篇研究論文稱，麥多奇和合作者搭建了一個世界，那裏的機器人要負責完成某些任務，例如自己移動到一個特定的位置上。這個世界很簡單，只是一個大大的白色正方形，所有的東西都是二維的——機器人則是彩色的，比如綠色、紅色或藍色圓圈。但是這個世界的意圖更加複雜一些：它讓機器人創建自己的語言，作爲一種合作的方式，幫助彼此完成這些任務。

所有這一切都是通過“強化學習”來完成的。谷歌DeepMind AI實驗室研發的圍棋機器人AlphaGo所使用的基本技術同樣是“強化學習”。簡單來說，就是機器人在它們的世界中摸索，反覆試錯，對於實現一個目標（比如到達一個特定位置），機器人仔細記錄下怎麼做行得通，怎麼做行不通。如果一個特定的行動有助於機器人達成這個目標，它們就知道需要繼續這麼做。它們也會以同樣的方式學會建立自己的語言。告訴對方怎麼走，可以更快地找到目標。

麥多奇說：“我們可以把交談是否成功歸結爲：你最終找到那個綠色目標了嗎？”

爲了創造語言，機器人把隨機的抽象字符分配給它們在虛擬世界學到的一些簡單概念。它們給其他機器人分配字符，分配給虛擬世界中的位置或對象，還分配給“去”或“看”這樣的動作。麥多奇和他的同事希望，隨着這些機器人語言變得更加複雜，相關的技術可以把它們的語言翻譯成英語等等。距離那一步還有很長的路要走——但OpenAI的另一個研究者已經在做這種“翻譯機器人”了。

麥多奇說，最終，這些方法可以讓機器更深入地掌握語言，展示爲什麼語言會存在——併爲真正的對話提供了一個跳板，這是計算機科學家長久以來的夢想，但卻從未真正做到過。

這些方法明顯不同於和語言有關的近期AI研究。如今，頂尖研究人員通常採取的做法試圖模仿人類語言，而不是創造一種新的語言。圍繞深度神經網絡進行的研究就是一個例子。近年來，深度神經網絡（一種複雜的數學系統，可以通過在大量數據中尋找模式來學習執行任務）已經被證明是一種非常有效的方法，可以用來識別照片中的對象，以及識別智能手機中的命令等等。目前像谷歌、 Facebook和微軟等公司的研究人員正在使用類似的方法來理解語言、尋找識別英語會話中的模式，迄今爲止，它們取得的成果還很有限。

麥多奇和他的合作者（包括OpenAI研究員、加州大學伯克利分校教授Pieter Abbeel）懷疑這種方法未必可行，所以他們採取了一個完全不同的切入點。“對於可以與人類互動的機器人來說，僅僅捕獲統計模式是不夠的，”他們在文章中說。“一個機器人要在它所屬的環境中使用語言（以及其他工具，比如非言語交流或肢體行爲）來實現目標，就需要它對語言有所理解才行。”

人類早期之所以能掌握語言，是因爲有這種必要。他們之所以學會了溝通，是因爲溝通有利於他們開展一些活動，獲得相對於其他動物的優勢。OpenAI研究人員想爲機器人創建相同的環境。在虛擬世界中，機器人不僅要學會它們自己的語言，還要使用簡單的手勢和動作來進行溝通——比如指出特定的方向，或者把彼此從一個地方引到另一個地方——很像人類小寶寶做的那樣。這也是語言，或者至少是通向語言的一條路徑。

然而很多AI研究人員都認爲，深層神經網絡方法仍然會有效果，它通過數據中的統計模式來弄清語言的奧祕。

儘管如此，麥多奇的項目表明，分析大量數據不是唯一的途徑。系統還可以通過自己的行動來學習，這可能會帶來非常不同的好處。 OpenAI的其他研究人員在使用一個更大更復雜的虛擬世界（他們稱之爲“宇宙”）來嘗試同樣的想法。在“宇宙”中，機器人可以學習使用常見的軟件應用程序，如Web瀏覽器。這也是通過強化學習的一種形式來實現的。對於OpenAI的創始人之一伊爾亞·蘇茨克維（Ilya Sutskever）來說，這種做法是通向理解語言的另一條道路。只有當AI理解人類談話的自然方式之後，它才能瀏覽互聯網。同時，微軟也正在通過其他形式的強化學習來解決語言問題，斯坦福大學的研究人員也正在探索自己的方法，對於機器人之間的協作。

最後成功的，可能不是這些技術中的其中一個，而且它們融合起來的結晶。麥多奇提出了另一種技術——機器人不只要學會聊天，還要學習用自己創建的語言聊天。人類的歷史已經顯示，這是一個非常強大的想法。

Tags：聊天研究人員語言學習機器人