TOP100summit分享實錄 | 「來也」胡一川:吾來對話機器人解決方案

圖片描述
本文內容節選自由msup主辦的第七屆TOP100summit,「來也」聯合創始人兼CTO胡一川分享的《吾來對話機器人解決方案》實錄。算法

分享者胡一川,「來也」聯合創始人兼CTO,本科和碩士畢業於清華大學,博士畢業於賓夕法尼亞大學,創立「來也」以前,曾聯合創立了影視推薦引擎」今晚看啥」並被百度收購,後加入百度任資深架構師。網絡

編者按:2018年11月30日-12月3日,第七屆全球軟件案例研究峯會在北京國家會議中心盛大開幕,現場解讀2018年「壹佰案例榜單」。本文爲「來也」聯合創始人兼CTO胡一川老師分享的《吾來對話機器人解決方案》案例實錄。架構

今天在座的各位大部分是IT行業技術從業者,因此我會重點介紹對話式人工智能中的核心技術,並經過吾來對話機器人解決方案,讓你們瞭解咱們如何使用這些技術,去解決不一樣場景中人機對話的問題。機器學習

首先,簡單作一個自我介紹。我是胡一川,「來也」的聯合創始人和CTO。「來也」主要作智能對話的技術,爲企業和我的打造智能對話機器人。今天,我重點分享咱們面向企業的對話機器人解決方案「吾來」,它的核心價值在於將對話式的AI能力產品化,幫助企業解決在各類業務場景中打造對話機器人,提高效率。學習

適合對話機器人的三類場景編碼

咱們將適合對話機器人落地的場景分爲三類。第一類是一些人機交互方式比較受限的場景,好比在車載、智能音箱、可穿戴設備等,在這些場景中天然對話是惟一的體驗較好的人機交互方式,所以對話機器人很是重要。第二類是生活中一些發生在人與人之間的簡單重複的交互場景,在這些場景中,咱們能夠用對話機器人替代人工,好比在線客服、呼叫中心等。第三類場景是將對話機器人和傳統圖形化交互界面相結合,這更可能是在一些營銷和推薦場景,經過增長天然對話的交互方式讓用戶的體驗變得更好,從而提高轉化率。人工智能

三種不一樣的對話類型spa

從技術的角度,咱們一般將對話分爲三種類型:問答型對話、任務型對話、閒聊。blog

問答型對話:用戶有一個問題,但願對話機器人進行交互尋求關於這個問題的答案。機器人的回覆來自於特定領域的知識庫,機器人的效果以回答準確率來評估。排序

任務型對話:用戶有一個意圖,但願對話機器人幫他完成一個任務。機器人經過多輪對話引導、澄清並知足用戶需求。在任務型對話中,機器人的效果以任務完成率來評估。

閒聊:像你們日常生活中的寒暄,例如,微軟小冰就屬於閒聊機器人。這種機器人是以相關性,趣味性做爲評估的指標。

接下來,我將分別介紹這些對話機器人背後用到的技術、算法和模型。

基於知識庫的問答型對話

下圖是基於知識庫的問答型對話。基於這個系統的問答機器人本質是在特定領域的知識庫中,找到和用戶提出的問題語義匹配的知識點。

clipboard.png

在吾來對話機器人解決方案中,咱們針對不一樣的狀況選擇相應的問答型對話解決方案,包括:基於分類模型的問答系統、基於檢索和排序的問答系統、基於句向量的語義檢索系統。

基於分類模型的問答系統

clipboard.png

第一種方案,基於分類模型的問答系統將每一個知識點各分一類,使用深度學習、機器學習等方法,效果較好。但須要較多的訓練數據,且更新類別時,從新訓練的成本較高,所以更適合數據足夠多的靜態知識庫。

基於檢索和排序的問答系統

clipboard.png

第二種方案,基於檢索和排序的問答系統能實時追蹤知識點的增刪,從而有效彌補分類模型存在的問題。但仍然存在檢索召回問題,假如用戶輸入的關鍵詞沒有命中知識庫,系統就沒法找到合適的答案。

基於句向量的語義檢索

clipboard.png

第三種方案,是基於句向量的語義檢索。經過句向量編碼器,將知識庫數據和用戶問題做爲語義向量輸出,基於句向量的語義檢索能實如今全量數據上的高效搜索,從而解決傳統檢索的召回問題。

這個架構最核心的模塊是句向量編碼器,它須要經過標註的句對數據來訓練,基本原理以下圖所示:

clipboard.png

任務型對話系統的架構

任務機器人在特定條件下提供信息或服務,以知足用戶的特定需求,例如查流量、充話費、訂機票、訂餐、等等。因爲用戶需求複雜多樣,任務機器人通常經過多輪對話明確用戶的目的。

下圖是傳統的任務型對話的總體架構,分爲5個模塊,分別是:語音識別(ASR)、語義理解(NLU)、對話管理(DM)、語言生成(NLG)、語音合成(TTS)。

clipboard.png

我今天重點爲你們講述NLU模塊和DM模塊相關的內容。以下圖所示,NLU模塊的輸入是用戶所說的天然語言,它的輸出是可被計算機處理的結構化信息,咱們稱爲用戶對話動做(User Dialog Act)。用戶對話動做又會做爲DM模塊的輸入。基於當前的對話狀態,以及當前的用戶對話動做,DM模塊肯定系統對話動做。系統對話動做肯定後,對話狀態也隨着發生變化。

clipboard.png

接下來咱們來說一講關於DM的常見技術方案和模型:

第一種方案是基於有限狀態機(Finite State Machine)的對話管理,它把對話狀態都映射爲系統動做,狀態之間的跳轉以用戶當前的輸入做爲條件,而後經過有限狀態機映射到下一個狀態。這種方案只適合特定的對話類型,狀態太多時很難維護。

第二種方案是基於幀(Frame)的對話管理。幀的定義是槽位的集合,槽位表明的是用戶須要提供的信息。經過這種方式,對話狀態被簡化成了哪些槽位已經被填充,哪些槽位沒有被填充,而系統的動做選擇就是下一步應該填充哪個槽位。這種方案雖然簡單,但也有不少侷限性,只適合較爲簡單的任務型對話場景。

第三種方案是基於計劃(Agenda)的對話管理。這種方案是對Frame的改進,把它從一個沒有邏輯關係的平級槽位變成一個樹狀的結構。這種樹狀的結構裏面是有層次的,並且樹狀結構是能夠動態調整的。

第四種方案是基於深度強化學習的對話狀態跟蹤,經過神經網絡將對話上文映射到系統動做,無需顯示定義對話狀態。這是基於機器學習的方法,須要有大量真實的、標註的對話數據,因此不太適合冷啓動。

針對不一樣場景,咱們有什麼解決方案?

場景一:智能客服

在客服場景下,對話機器人有兩個用途:

一、經過對話機器人7×24實時的知足用戶關於業務諮詢、業務辦理等方面的需求,提高用戶的體驗。

二、對話機器人可以提供人機協做的模式,做爲人工客服的助手來減輕客服的負擔,提高客服的工做效率。同時它還能完成智能質檢工做,保障服務質量。

clipboard.png

基於吾來對話機器人解決方案,咱們爲中國移動10086App打造了在線智能客服及個性化推薦服務。該對話機器人可爲用戶提供充流量、充話費等服務,既提升了服務效率也提高了用戶體驗。

場景二:智能下單

在圖形化的用戶下單的操做界面中,若是加入對話機器人,能提升用戶的操做效率,實現「一句話下單」,並給用戶更爲個性化的體驗。對話機器人可以識別多種的表達方式,利用天然語言主動交互與多輪對話控制,引導用戶下單,從而提高訂單的轉化率,同時提高用戶的滿意度。

clipboard.png

基於吾來對話機器人解決方案,咱們爲麥當勞打造了智能對話點餐機器人。該機器人支持對話流中的餐品查詢,經過主動澄清的方式逐步引導用戶下單,成爲圖形化交互界面的有益補充。

場景三:智能營銷

在線營銷的場景下,對話機器人經過檢測訪客行爲,能主動發起關懷,提升用戶激活率;同時,對話機器人還能提供全天候服務,捕獲高質量銷售線索,提升營銷轉化效率。

clipboard.png

基於吾來對話機器人解決方案,咱們爲學旅家打造了銷售線索生成機器人。該機器人可逐步引導用戶提供基本信息及偏好,生成高質量線索表單,方便銷售人員進行更有針對性的線索轉化。

總結

在將來,愈來愈多的企業/我的會把對話機器人用於工做和生活中。一個對話機器人可否成功落地,在我看來主要有兩點:一是對話機器人有清晰的領域邊界,即對話機器人能幹什麼,不能幹什麼,須要事先想清楚;二是收集足夠多的領域數據,這樣才能訓練出的一個具備語義理解、多輪對話能力的對話機器人,知足用戶的需求。

以上內容來自胡一川老師的分享。

聲明:本文是由壹佰案例原創,轉載請聯繫 meixu.feng@msup.com.cn

相關文章
相關標籤/搜索