基於知識圖譜的相關應用大體能夠分爲搜索、問答、決策、推薦等幾種常見的類別,對於知識圖譜的理解,能夠參考以前的文章《三個角度理解知識圖譜》,本文主要就年初規劃的xx智能問答建設方案,介紹一下基於知識圖譜的智能問答,主要分爲以下幾個方面:算法
一、人機對話體系結構api
二、問答產品知識結構微信
三、典型的智能問答產品網絡
四、智能問答的關鍵技術架構
五、基於知識圖譜的智能問答框架
一、人機對話體系結構機器學習
對於一個基於人機對話的問答系統,主要包括喚醒、識別、理解、反饋四個過程,其中語音喚醒、語音識別、天然語言生成以及語音合成是爲用戶的語音體驗服務的,而問答的核心部分是對問題進行理解,並給出相應的答案,主要涉及到語言理解、語義搜索、知識圖譜、情感分析、對話管理以及深度問答等。對於不一樣的問答系統能夠對該體系中的相關部分進行增刪和修改,或當作一個由簡單到完善的發展過程。好比,對於xx問答系統,在初期階段,可能作不到語音問答的形式,那麼,重點就應該落在理解這個部分,以實現初步的文本識別、文本理解和文本回答。工具
二、問答產品知識結構學習
問答類產品的主要目標是輸入問題,得到答案。從問題的類型上能夠分爲事實類/非事實類,不一樣類型的處理方式以及技術難度都存在必定差別。在問答形式上能夠分爲單輪問答、多輪以及聊天式的情感互動,其中單輪問答相對簡單,多輪問答以及情感互動還處於較爲初級的發展階段。對於問答系統的實現方式也有多種,對技術需求也不盡相同,要根據具體的需求具體規劃。搜索引擎
三、典型的智能問答產品
Siri 做爲 iPhone 4S 推出時的一個亮點特徵,定位是語音我的助理。在推出之時,引發了極大的轟動。雖然這麼多年 Siri 的技術也不斷提高,但他更大的價值是做爲聊天機器人之門開啓的開門磚,教育了用戶和市場。回到剛剛的分類,Siri 實際上是一個面向特定任務的對話系統。對接了不少本地服務如通信錄、音樂播放等以及 Web 服務如訂餐、訂票和導航等功能服務。針對這些服務意圖,他經過實體驅動的天然語言理解(Natural LanguageUnderstanding, NLU)來識別問句中涉及到的對象和相關服務,從而實現特定任務下的多輪功能交互。對於解決不了的問題,即服務意圖範疇外的需求,則直接調用搜索引擎返回相關答案來返回。隨後,Siri 的核心人員 Dag Kittlaus 和 Adam Cheyer 於 2016 年推出了 Viv。Viv 被認爲是 Siri 的升級版,雖然其在多服務組合,服務編排等方面作了很多亮點工做,但背後的基本原理和定位和 Siri 無差別。
微軟針對娛樂化和工具化這兩個大相徑庭的定位,分別推出了小冰和小娜(Cortana)。小娜,做爲嵌入在 Windows 或 Windows Mobile 等微軟操做系統內核的語音我的助理,承載着相似 Siri 或 Viv 的角色,它的目的是提高用戶的工做效率,聽說 Cortana 有 1.5 億多用戶,這也使得微軟吸引到 Bengio 這樣的大師做爲顧問加入。另外一方面,小冰是微軟中國團隊推出的娛樂聊天機器人。她的人設是一位 16 歲的少女。小冰是一個基於搜索的回覆檢索系統。經過各類基於深度學習的語義匹配算法,從海量的問答對語料中返回最佳的回覆(Message response 而非 Answer)。小冰也會不按期推出新的技能供你們使用,這些技能每每包含了微軟團隊在圖像理解、語音和天然語言理解方面的各類小應用嘗試。更值得一提的是:微軟針對日本、北美和歐洲等市場陸續推出了具備不一樣人設的少女如 Rinna、Tay和 Zo,她們每每能夠方便的經過微信、微博或 Twitter 等平臺進行交流。
Watson 系統是典型的問答系統,其由 IBM 研究院在 2011 年推出,參加美國知識競賽Jeopardy!(危險邊緣)並挑落人類冠軍而名聲大躁。相比 AlphaGo 或早年 IBM 研製的打敗卡斯帕羅夫的國際象棋人工智能程序深藍,Watson 具備更清晰的商業路徑。IBM 斥巨資成立醫療事業部,並與 MD Anderson 等知名醫療機構合做推出面對特定病種(尤爲是癌症)的輔助診斷 AI 醫生。與此同時,Ross Intelligence 依託 Watson 認知計算平臺推出了法律諮詢系統。回到技術層面,Watson 所用到的知識庫是一個廣義的知識庫,不只包含各類結構化知識、也包含各類文本語料和語言學知識。整個流程稱爲 Deep QA,包含問題分解、假設生成、基於證據的融合排序等關鍵步驟。這裏的 Deep QA 並不是指經過深度學習(Deep Learning)技術來提供問答。事實上,Watson 誕生於深度學習大熱以前,這裏的Deep 是指經過深度解析(Deep Parsing)來實現對問句的真正理解。
Facebook Messenger 是一個龐大的 Bot 平臺,有很是活躍的開發者羣體,平臺包含上萬種 Bots。針對 Messenger,第一,它在 2014 年收購了 wit.ai。Wit.ai 相似於谷歌所收購的 api.ai,包含大量的行業相關或場景相關的對話。基於以上高質量海量的對話數據,Facebook 基於深度學習技術推出了一個用於天然語言處理的框架叫 DeepText,用於天然語言表示學習和各類分類等任務。有名的 Fast Text 也包含在內。Facebook 更是基於Deep Text 推出了 CLUE,進一步提升了其易用性。經過以上的數據和技術積累,Facebook就可快速構建一個端到端的 Chatbot 或者問答系統。此外,還有一點須要強調的是,咱們能夠發現 Facebook Bot 的不少應用場景涉及到購物、遞送禮物、預定參觀和安排旅程等非實時任務,即相對比較複雜,但不要求立刻獲得反饋。傳統的作法是,經過指派一名客服來對接,提供進一步的服務。對於這些非實時任務,Facebook 結合機器返回的自動化推薦結果和人工的進一步編輯和審覈來保證用戶體驗的同時也下降了純人工對接存在效率低、工做量大等弊端。而這也是近期你們很推崇的人機融合,即賦予人工智能新的內涵:ArtificialIntelligence+Human Intelligence(人類智能)=Augmented Intelligence(加強智能)。
Alexa 做爲亞馬遜 Echo 智能音箱背後的 Bot 框架,經過 Skill Set 的形式不斷擴展其功能,其內核是亞馬遜在 2016 年末發佈的 Lex,並對接專一圖像識別的 Rekognition 和基於機器學習特別是深度學習技術的快速 TTS(文本到語音轉換)。細心的觀衆會發現 Echo 音箱並無提供任何屏幕,僅經過語音進行交互,依託 Amazon 的內容資源和電商購物優點提供各類智能交互。這種以語音爲主的交互方式在家庭、車載等領域獲得普遍關注和應用,由此也提出了 Voice UI 的概念。除了語義理解,這裏須要強調的是:對於 Echo 音箱的交互,是採用遠場(一般 3-5 米)溝通的。對於遠場語音交互,目前遠比近場通信的難度大,涉及到聲源定位、噪聲(如回聲、背景噪聲、各類聲波反射折射產生的混響)消除、人聲分離、聲音加強甚至是聲紋識別等各類技術挑戰。目前通用的作法是採用麥克風陣列+波束成形等方案,不過有很大的提高空間。不過智能音箱是否能在中國成爲一個爆款,這個仍是一個未知數,固然這裏涉及到更多使用習慣、價格、內容質量等不少非技術因素的考量,在此就不作具體展開。
從 Google Now 到 Google Assistant,谷歌一直沒有中止過在語音我的助理方面的嘗試。Allo是基於 Google Assistant 的新一代人工智能類微信 IM 應用。Allo 具備幾個亮點:首先,其具有必定的自我學習能力。這裏包括兩方面的學習,一方面是學習用戶的習慣,包括說話風格和交互模式。值得一提的是,Allo 的開發者也參與了 Gmail Smart Reply功能的開發,幫用戶草擬回覆的郵件。具體來講,根據郵件接收的對象、主題和關聯的場景等,根據用戶口吻來儘可能完成要回復內容。另外一方面也包括用戶偏好的學習,這一點在推薦系統中是很是重要的,屬於用戶畫像的學習。Allo 學習用戶畫像的低維稠密向量化表示(User Embedding)。將 User Embedding 加入 Chatbot 的回覆生成解碼模型中,將有助於回覆的相對一致性和個性化。
度祕(英文名:Duer)是百度出品的對話式人工智能祕書,2015年9月在百度世界大會中推出。它是基於DuerOS對話式人工智能系統,經過語音識別、天然語言處理和機器學習,用戶可使用語音、文字或圖片,以一對一的形式與度祕進行溝通。目前DuerOS已經具有10大類目100多項能力,能夠爲不一樣行業的合做夥伴賦能,普遍支持手機、電視、音箱、汽車、機器人等多種硬件設備,實現語音控制、平常聊天、直接提供多種O2O服務等的智能化轉變,被國內外同行稱爲「具備劃時代意義的對話式人工智能操做系統」。依託於百度強大的搜索及智能交互技術,度祕能夠在對話中清晰的理解用戶的多種需求,進而在普遍索引真實世界的服務和信息的基礎上,爲用戶提供各類優質服務。
搜狗汪仔機器人是搜狗公司打造的問答機器人,搜狗汪仔能聽、會說、會看、會思考,表明了人工智能領域的前沿技術。搜狗汪仔背後依靠的是基於人工智能技術的搜狗立知問答系統。立知問答系統是搜狗搜索研發的面向將來的搜索技術,在理解用戶的問題或信息需求後,利用海量網絡信息及大規模知識庫,直接給出答案,方便快捷,適用於多種交互方式。其背後蘊含語義分析、問題理解、信息抽取、知識圖譜、信息檢索、深度學習等衆多技術。
阿里小蜜是一個無線端多領域私人助理,依託於客戶真實的需求,經過智能+人工的方式提供客戶極致的購物體驗服務,提高客戶留存並創造價值。在跨終端、多場景領域支持多輪交互、多模式交互(文本、語音和圖像)和問題推薦預測、支持多模型識別客戶意圖,基於客戶需求的垂直領域(服務、導購、助手等)均經過智能+人工的方式提供客戶極致的客戶體驗。
靈犀是中國移動和科大訊飛聯合推出的智能語音助手,更是國內首款支持粵語的語音助手。靈犀既能語音打電話、發短信、查天氣、搜航班,還能查話費、查流量、買彩票、訂彩鈴,還能夠陪你語音閒聊講笑話。
其它還包括叮咚智能音箱、小i機器人、海知智能的機器人等。這裏的智能問答助手主要都是經過機器人、虛擬語音助手、音箱等形態來承接,而且具備多模態識別以及服務推薦、引導、聊天等功能,比通常的文本問答都更智能、更方便。
四、智能問答的關鍵技術
根據AI應用能力框架,對於智能問答系統的能力需求,能夠分爲基礎能力、業務積累以及智能技術三部分。其中基礎能力主要是解決智能問答中的比較基礎的、通用的、基礎的能力如敏感詞過濾、多種問法識別等;業務積累主要是指針對具體的問答領域,在業務上所需積累的經驗,好比大體能夠把問題分紅幾類,每種類型有哪些,通常採起什麼樣的回答方式等;智能技術主要是面對更高級的應用的技術,如怎樣實現多輪對話、識別多種模態、動態載入等。
目前國際上的智能問答技術主要採用檢索技術、知識網絡、深度學習這三大技術,固然,對於以上三種技術最後都須要應用在天然語言處理領域才能最終實現所需的功能。
問答系統可分爲面向任務、面向知識和麪向聊天三類,從關鍵技術上分,還能夠把其分紅基於搜索技術的問答系統、基於協同的問答系統、基於知識庫的問答系統。
面向任務的問答系統是一種閉域應用,一般使用基於規則的或基於模板的方法,並採用對話狀態跟蹤技術。在幫助服務中所使用的槽位填充方法,就是一種基於模板的方法。
面向知識的問答系統可用於閉域和開放域,一般使用以數據爲驅動的信息檢索模型。該類方法基於從問答知識庫中查找與提問問題最匹配的知識。一份最新的研究工做嘗試使用基於神經網絡的方法實現問題間的匹配。最經常使用的一種方法是基於知識圖譜與信息檢索相結合的方法,檢索知識圖譜可給出高準確率的問答,並以信息檢索爲補充。
基於聊天的問答系統經常使用於開放域,使用方法包括信息檢索和生成模型。
五、基於知識圖譜的智能問答
對於知識圖譜的構建須要從兩個角度來進行抽象,一個是實體維度的挖掘,一個是短句維度進行挖掘,經過獲取各類網上積累的大量數據,經過主題模型的方式進行挖掘、標註與清洗,再經過預設定好的關係進行實體之間關係的定義最終造成知識圖譜,下表爲知識圖譜做爲問答匹配的優缺點對比:
基於知識圖譜的問答匹配
優勢
缺點
對於知識圖譜處理問答匹配的流程通常能夠總結爲以下圖,主要包括8個過程:
基於知識圖譜的智能問答,以上只是一種簡單的實現方式,實際的狀況遠比這個要複雜,若是要達到比較好的智能問答效果,須要在語料庫、技術架構、算法、業務理解等方面下功夫。這裏借用電信業務場景的智能問答機器人的架構,簡單展現一下具體的邏輯架構,更多詳細資料能夠參考相關論文(基於電信業務場景的智能問答機器人關鍵技術)。