谷歌開放天然語言理解軟件源代碼: 這項技術讓電腦理解天然語言

從今天開始,谷歌給外界軟件開發人員開放了天然語言算法, 併發布幫助開發者構建基於語言的應用和服務的工具,助力開發比常常產生誤解聊天機器人更好的應用。 算法

一個今天發佈的工具,叫作 SyntaxNet,在有語境和經常使用註釋的狀況下,能夠學會理解單詞和短語的意思。這個工具使用了原先由谷歌發佈叫 TensorFlow 的深學習框架。它是一個使用 TensorFlow 迄今構建的最複雜的部件。網絡

谷歌還發布了預先訓練的英語解析器,稱爲 Parsey McParseface。輸入該英語解析器的文本將自動被分紅句法組分如名詞,動詞,主題和對象。這使得計算機能容易地解析不明確的查詢或命令。併發

圖片描述

谷歌一般依賴於數據和機器學習的方法,Facebook 就正在試圖培養計算機解析語法, 經過輸入大量未標註的數據(見「教學機器理解咱們」)。可是,谷歌的語言理解項目,在網上的一篇論文中說,是基於專家的專業知識。八年多來,語言專家一直在努力爲谷歌註釋文本。而最近的進展是把這些標註數據輸入大型深學習神經網絡的結果。框架

理解語言對於計算機很是困難的,由於語言一般是模糊的。搜索簡單的 「Find me cats in hats」,能夠解釋爲戴帽子或貓坐在帽子。雖然人類使用通常知識來理解這樣的句子,谷歌的技術採用機器學習。其深度學習系統,通過語法文字的訓練,作出這句話的最有可能的正確結構的判斷。在 「Find me cats in hats」 這句話的狀況下,這個算法假定搜索者時尚前衛的貓科動物有興趣。機器學習

原文連接: https://www.technologyreview.com/s/601440/googles-algorithms-decode-language-like-a-trained-linguist/工具

相關文章
相關標籤/搜索