從1956年被認爲是全球人工智能研究起點的學術會議,到2016年,AIphaGo與世界頂級圍棋高手李世石的人機世紀對戰,掀起了人工智能浪潮的新高潮。人工智能彷佛離咱們愈來愈近,並在許多方面服務人類。但必須認可的是,人工智能要經過天然語言處理與人類自如交流仍是一個「終極挑戰」。如何應對這些挑戰,以及當下的人機交互實踐,今天這篇文章由香儂科技創始人兼CEO李紀爲老師爲你們詳細解答。算法
人工智能的終極難題之一:人機對話數據庫
人機對話,是人工智能領域的一個子方向,通俗的講就是讓人能夠經過人類的語言(即天然語言)與計算機進行交互。做爲人工智能的終極難題之一,一個完整的人機對話系統涉及到的技術極爲普遍,例如計算機科學中的語音技術,天然語言處理,機器學習,規劃與推理,知識工程,甚至語言學和認知科學中的許多理論在人機對話中都有所應用。當下,咱們都使用太小度或者siri,給你們最直觀的感覺就是很弱智,咱們想要解決的問題就是如何讓對話系統變得不弱智。網絡
在現實生活中,對話就是咱們平時的聊天,內容會依據環境、心情、目的、年齡等不斷變化,咱們的願景是但願機器能夠像人同樣聊天的人工智能。但人工智能從上世紀50年代萌芽,由圖靈測試的猜到現在的siri,發展到今天,機器依然不能處理複雜對話。如美國的一個真人秀演員在節目裏調戲siri,跟siri聊天,想讓你們看siri有多智能、多聰明。當他讓siri寫一個節目,siri會發現一個問題,當問siri稍微複雜點的問題時,它不懂就會搜索,會問什麼意思,要搜點什麼。從這個例子中看出,整個對話缺乏整個事件或者聊天的人,siri並不知道它是誰、後面包含是什麼特質,也不知道要作什麼。所以,siri目前是比較弱智的,它出現的這些錯誤究其背後是算法框架的錯誤。對話系統裏,有匹配說話的觸發詞,會觸發數據庫規定的某些場景,這些場景最重要的是要明白這句話的目的是什麼,最後由分類器把說的話連起來,再根據上下文觸發後面的對話。框架
人工智能的人工:對話系統機器學習
對話系統被認爲是整我的工智能的人工,它涉及到兩個部分,理解和生成。這兩個涵蓋了天然語音處理的全部任務。目前這兩個任務都沒有很完全的被解決掉。基於此,對話系統整個處理方式把整個框架分紅兩個模塊,也是理解和生成。固然除了這幾點還有不少其餘的方面,如跟人聊天,每一個人都有本身的語義,有本身的說話方式;另外一方面,爲了能讓談話持續下去,應是交互性的讓人家願意聊,互相在氣氛中找到本身想要談話的慾望。學習
歷史上過去50年間,自從圖靈測試被提出後,如何解決這個問題。美國開發了Eliza,它是人工智能裏面很是重要,且出如今上個世紀60年代,人工智能剛剛興起的時間。它是在邏輯、專家系統知識系統背景下提出的對話模型,這個對話模型引發了很大震動,它想去模擬做爲心理醫生,要跟有抑鬱的人作輔助治療,這個提出也經過圖靈測試。這樣的系統,在那個時代給咱們帶來很大的衝擊,後來這個系統被真正的心理指導人去用,一直持續40年的時間。直到上個世紀末,依然有人認爲我在跟Eliza聊天。測試
從產品的角度看出Eliza沒有用很是複雜的算法可是解決了痛點,說明不復雜的算法也能解決現實問題。這個圖表明瞭現有的包括小度的框架系統。第一步ASR,語句進來先把聲波變成字。下面涉及到兩個框架,一個是NLP,理解這句話是什麼,下面一個模塊就是基於理解的這句話,去產生一句話,到最後輸出。 其中對於理解語義併產出,是從系統裏的語料庫裏去挑選,若是目標語句不在語料庫裏,須要本身生成的時候,催生出機器翻譯。編碼
機器翻譯是經典傳統的天然語言處理任務,有很長的歷史,基本在人工智能出現以後就有這個任務,一樣解決辦法也是跟人工智能流派相關。在六七十年代,人們嘗試解決機器翻譯。在90年代發明了IBM model,這是第一次在早年把統計機器模型引到天然語音處理裏,經過大量的平行語料,不須要字典就能學出詞和詞的對應關係。這個模型用了大概20年,直到2014年末才被神經網絡模型完全取代。人工智能
目前,人機對話仍在高速發展,小度、siri等智能機器人的發展,代表人工智能開始從科學家的實驗室「飛入尋常百姓家」。每一個人,都是這次媒介變革和科技創新的見證者。同時也是中國人工智能和機器人研究能力的飛躍。spa
提問環節
提問:想請問有沒有研究過結合的。
李紀爲:只是基於不一樣的進來的信息,進來的是一個圖象,用CN把圖象編碼,機器翻譯是基於我前面一句話,你要翻譯,機器對話系統是基於上下文,本質上基本沒有區別。
提問:若是基於本來圖片有的標籤,獲得的結果是比較單一的,咱們考慮使用深層對話網絡,深層對話網絡結果有隨機性,應該是能夠產生對圖片的描述。
李紀爲:並無普遍的應用是有緣由的,語言是不連續的。
提問:看到兩篇文章,我以爲對這方面的研究不是不少。這個方向是否是能夠進一步研究。
李紀爲:是一個好的方向,我會認爲天然語言,應該是一個大的發展方向,這個東西全部人都會認爲應該用。
李紀爲,香儂科技創始人兼CEO,百度獎學金得到者。著名青年 AI 學者,主要研究領域爲天然語言處理、深度學習、機器學習。斯坦福大學計算機專業歷史上第一位僅用三年時間就得到博士的人。在近日由劍橋大學研究員 Marek Rei 發佈的一項統計中,李紀爲博在最近三年世界全部人工智能研究者中,以第一做者發表的頂級會議文章數量高居第一位。