谷歌開放天然語言理解軟件源代碼: 這項技術讓電腦理解天然語言

時間 2019-12-06

原文原文鏈接

從今天開始，谷歌給外界軟件開發人員開放了天然語言算法，併發布幫助開發者構建基於語言的應用和服務的工具，助力開發比常常產生誤解聊天機器人更好的應用。算法

一個今天發佈的工具，叫作 SyntaxNet，在有語境和經常使用註釋的狀況下，能夠學會理解單詞和短語的意思。這個工具使用了原先由谷歌發佈叫 TensorFlow 的深學習框架。它是一個使用 TensorFlow 迄今構建的最複雜的部件。網絡

谷歌還發布了預先訓練的英語解析器，稱爲 Parsey McParseface。輸入該英語解析器的文本將自動被分紅句法組分如名詞，動詞，主題和對象。這使得計算機能容易地解析不明確的查詢或命令。併發

谷歌一般依賴於數據和機器學習的方法，Facebook 就正在試圖培養計算機解析語法，經過輸入大量未標註的數據（見「教學機器理解咱們」）。可是，谷歌的語言理解項目，在網上的一篇論文中說，是基於專家的專業知識。八年多來，語言專家一直在努力爲谷歌註釋文本。而最近的進展是把這些標註數據輸入大型深學習神經網絡的結果。框架

理解語言對於計算機很是困難的，由於語言一般是模糊的。搜索簡單的「Find me cats in hats」，能夠解釋爲戴帽子或貓坐在帽子。雖然人類使用通常知識來理解這樣的句子，谷歌的技術採用機器學習。其深度學習系統，通過語法文字的訓練，作出這句話的最有可能的正確結構的判斷。在「Find me cats in hats」這句話的狀況下，這個算法假定搜索者時尚前衛的貓科動物有興趣。機器學習

原文連接： https://www.technologyreview.com/s/601440/googles-algorithms-decode-language-like-a-trained-linguist/工具