檢索式chatbot：word2vec/GloVe/fasttext

前言：本文做者@我偏笑，是咱們「AI產品經理大本營」成員，也是「AI研習小分隊」的分享嘉賓之一（每4周分享一篇AI產品經理相關的學習心得總結）；歡迎更多有興趣「主動輸出」的朋友們一塊兒加入、共同進步：）

序言

以一週前的這條微博做爲開始——

一週前我講：相對的，天然語言解析技術已經逐漸再也不成爲各家廣義智能助理產品的核心競爭力，識別用戶意圖以後所提供的服務開始成爲對話機器人差別化的核心。

對於一個對話系統而言，我微博中所指的『後續服務』，就是上圖中的 DST（對話狀態維護）以及 Policy（動做候選排序），或者統一的稱其爲 DM（Dialogue Mannagement，對話管理）。也即，當接收到 NLU 模塊的輸出、其餘場景及用戶特徵信息以後，判斷系統應該跳轉到什麼狀態，以及執行什麼樣的動做。

產品角度，DM 是對話機器人封閉域多輪對話體驗的核心，正是一次次 DST + Policy 造成了人機間的多輪對話體驗。（注：我我的傾向於將「識別用戶意圖以後，爲了獲取必要信息，與用戶進行的有目的的多輪對話」稱爲封閉域多輪對話，區別於識別用戶意圖以前，爲了利用上文信息，所採用的『上下文替換』、『主體補全』等技術，也即開放域多輪對話。下文提到的『多輪對話』，均指封閉域多輪對話。）

既然多輪對話在對話機器人類產品體驗中扮演着如此重要的角色，我便開始思考：一個架構完備的多輪對話體系應該是什麼樣的。也即，多輪對話系統中，至少須要包含哪些模塊，才能爲用戶提供一種與人人對話相去不遠的人機對話體驗。

1、多輪對話

多輪對話定義

我有個習慣，就是在構造一個複雜系統以前，先從紛繁的細節之中跳出，嘗試抽象的描述整個系統，及系統中的各個模塊，也即爲它們『下定義』。這能幫助你在多種可行方案中作出選擇，也即幫你明確：什麼該作，什麼不應作，什麼該誰作。

基於以上思想，我嘗試先給出幾個我我的對於多輪對話體系定義問題的回答——

基本定義：什麼是多輪對話？ （封閉域）多輪對話是一種，在人機對話中，初步明確用戶意圖以後，獲取必要信息以最終獲得明確用戶指令的方式。多輪對話與一件事情的處理相對應。

補充說明1：所謂『必要信息』必定要經過與用戶的對話獲取嗎？ 不必定，即使是人與人之間的交流，對話自己所包含的信息也只佔總傳遞信息量的小部分，更多信息來源於說話人的身份、當前的時間/地點等一系列場景信息。因此多輪對話的信息獲取方式，也不該當只侷限於用戶所說的話。

補充說明2：多輪對話必定在形式上表現爲與用戶的屢次對話交互嗎？ 不必定，若是用戶的話語中已經提供了充足的信息，或者其它來源的補充信息已足夠將用戶的初步意圖轉化爲一條明確的用戶指令，那就不會存在與用戶的屢次對話交互。

以上，是針對多輪對話總體定義問題的回答，每一個模塊的相關定義會在下文嘗試給出。

2、槽

一、槽（slot）

基本定義：什麼是槽？ 槽是多輪對話過程當中將初步用戶意圖轉化爲明確用戶指令所須要補全的信息。一個槽與一件事情的處理中所須要獲取的一種信息相對應。

補充說明：多輪對話中的全部的槽位都須要被填充完整嗎？ 不必定，以以下對話爲例——

我：『去蕭山機場多少錢』

出租車司機：『70』

對話中的『70』，應當被理解爲70元人民幣，而沒必要再去追問：『你說的是人民幣、美圓、日元仍是港幣？』。這類信息應當以默認值的形式存在，也即槽有必填與非必填之分，與上文所說的『信息未必須要經過與用戶的對話獲取』相對應。

二、詞槽與接口槽

上文反覆的提到，對話內容並非獲取信息的惟一方式，用戶身份以及當前場景也包含着大量值得被利用的隱含信息。因此，與此相對的，一個完備的多輪對話體系應當同時具有從用戶話裏以及話外獲取信息的能力。

我我的將「利用用戶話中關鍵詞填寫的槽」叫作詞槽，「利用用戶畫像以及其餘場景信息填寫的槽」叫作接口槽。

舉個例子，我講『我明天要坐火車去上海』。其中，分別將『明天』、『上海』填入名爲『出發時間』、『目的地』的詞槽中，而我當前所在的位置，則填入到了名爲『出發地』的接口槽中。

三、槽組與槽位

我我的將「利用用戶話中關鍵詞填寫的槽」叫作詞槽，「利用用戶畫像以及其餘場景信息填寫的槽」叫作接口槽。

舉個例子，我講『我後天要坐火車去上海』。其中，分別將『後天』、『上海』填入名爲『出發時間』、『目的地』的詞槽中，而我當前所在的位置，則填入到了名爲『出發地』的接口槽中。

不知道上文錯的如此離譜的結論，有沒有引發你的注意：）

仔細讀一遍上面舉的例子，就會發現一個很嚴重的矛盾點：難道『出發地』這個槽不能由用戶指定？用戶徹底能夠說『我後天要坐火車從北京去上海』，那它是詞槽仍是接口槽？並且更進一步的，難道只能用『我當前所在的位置』來填入『出發地』這個槽中？好比，若是能讀到個人日程表，發現我明天會去杭州，那是否是就應該用『杭州』而不是『我如今所在的位置』來填『出發地』這個槽了？

從中咱們能發現什麼呢？同一個槽，可能會存在多種填槽方式。

我將可能包含多種填槽方式的槽稱爲槽組，槽組下面可能存在任意多個槽位，也即任意多種填槽方式，而每一個槽位又都對應着『詞槽』與『接口槽』兩種槽位類型之一。

本質上來說，槽組（也即上文中提到的『槽』），對應着一種信息，而幾乎不會有哪一種信息的獲取方式只有一種。因此一個『槽』會同時對應多種填槽方式也就是天然而然的了。

依照上文，同一種信息會有多種獲取方式，也即同一個槽組會對應多種填槽方式（槽位）。那不一樣填槽方式之間必然會存在優先級的概念。

就如同上文『訂票』的例子，『出發地』槽包含三種填寫方式，一種詞槽、兩種接口槽，天然的，詞槽的優先級最高，『日程表中隱含的出發地』次之，『我當前所在的位置』再次。

若是將其與前文提到過的必填/非必填結合起來，其填槽過程應當遵循如下步驟：

嘗試填寫詞槽
若失敗，嘗試填寫第一接口槽『用戶日程表中隱含的出發地』
若失敗，嘗試填寫第二接口槽『用戶當前所在位置』
若失敗，判斷是否該槽必填
若必填，反問用戶，重填詞槽 *若非必填，則針對該槽組的填槽過程結束

咱們須要知道，必填/非必填在邏輯上與槽組而不是槽位平級，只有信息纔會分爲必要/非必要，填槽方式不作這種區分。並且是否必填實際上與接口槽無關，只取決因而否須要與用戶進行交互。

四、澄清話術

與槽組（也即與一種信息）平級的概念還有一個，叫作澄清話術。

澄清話術是對話機器人但願獲取某種信息時所使用的問句。好比『目的地』對應的澄清話術就是『您想從哪出發呢？』，『出發時間』對應的澄清話術就是『您想什麼時間出發呢？』。

顯而易見的，澄清話術與槽組而不是槽位平級。

五、槽的填寫

上文講到，一個槽組可能會有多個槽位，槽位存在詞槽與接口槽之分。

先說詞槽。

詞槽信息的抽取其實仍是有些麻煩的，不過這屬於解析的問題，不在本文探討的範圍內，這裏只是簡單提一下，舉兩個例子：

用戶表達『不』，可能會有『不行』、『不是』、『算了』、『沒有』等一系列說法。
用戶話中有多個符合條件的關鍵詞，咱們整套多輪對話中有多個槽，每一個槽填一個仍是多個值？哪一個槽與哪一個詞對應？

同義詞典、規則、雙向LSTM+CRF，各有各的方法。

再說接口槽。

接口槽與詞槽相比，額外存在一個問題，就是：接口返回的結果就是用戶須要的結果嗎？

這裏須要分紅兩種狀況來討論，一種是：咱們明確知道接口的返回值能夠直接填入槽位（不是槽/槽組）中，不須要向用戶確認。

特別的，這裏還要明確一點，即使是上述狀況，也並不意味着當前槽/槽組只有該特定接口槽這一個槽位。有兩種狀況存在：一種是該槽組下只有這一個槽位，該接口的返回值直接填入槽位中，也至關於填入了槽/槽組中；或者該槽位下有多個槽位，接口槽的填入值並不必定最終做爲槽/槽組的填入值。

另外一種是：咱們知道接口的返回值只能做爲參考，須要用戶的協助才能進行槽位的填寫。

這種狀況下，須要提供選項，讓用戶最終決定該槽位的填入值，與詞槽同樣，這裏一樣須要處理單值/多值的問題。單值/多值在邏輯上與槽組平級。

此外，這裏還要注意一個否定選項的問題，好比我對阿里小蜜說，我忘記密碼了，它會經過接口拿到個人當前帳號，而後將其提供選項給我，問『你是忘記了哪一個帳號的密碼？』，不過，除了我當前帳號以外，還有一個選項也被提供出來了，就是『不，不是這個帳號』。

這表明了一類問題的存在，用戶的意圖並不必定包含在接口的所有返回值之中。因此就必然會有這樣一種相似『不要/不是/不』的選項，我將其叫作否定選項。

用戶選擇否定選項後，即意味着該槽位的填寫失敗了，須要填入一個特殊值表明失敗。用戶選擇否定選項的失敗，能夠與接口調用失敗等其它意外狀況合併處理，由於這都意味着該槽位填寫失敗，意味着該種信息獲取方式未能成功獲取信息。

若是該槽組下只有這一個槽位，這個特殊的失敗表徵值就應看成爲整個槽組的填入值，若是還有其餘槽位值，則根據槽位間優先級最終肯定槽組填入值。

六、平級槽和依賴槽

上面說到底都在講一個槽組的填寫，也即一種信息的獲取，但多輪對話的目的是將初步用戶意圖轉化爲明確用戶指令，這其中所須要的信息一般都不僅有一種。

談完了槽組與槽位之間的關係，接下來談一下槽組與槽組之間的關係，也即信息與信息之間的關係。

爲了便於理解，我先舉兩個例子來表明兩種多輪對話中所包含的極端狀況。

第一種：訂車票，你須要知道用戶出發的時間、地點、目的地、座位種類。這四個槽組之間，沒有任何依賴關係。換言之，你只須要肯定好這四個槽組中必填槽組之間的澄清順序，接收到用戶問句後，對還未填充完成的必填槽組依次進行澄清便可。我將這四個槽組之間的關係稱爲平級槽關係。

另外一種，不知道讀者玩沒玩過橙光，或者其它多結局的劇情類遊戲。它們的特色是什麼呢？每個選擇都會有影響到後續劇情發展也即 每一個槽組的填寫結果會影響其它槽組的填寫。換言之，部分槽組依賴前序槽組的填寫結果，在其依賴的前序槽組填寫完成以前，該槽組都沒法進行填寫。我將槽組間的這種關係稱爲依賴槽關係。

這種狀況下，整個多輪對話過程就造成了一棵樹，極端狀況下，這棵樹是滿的。樹上的每一個節點放置着一個會對後續對話走向產生影響的槽組。

槽關係的選擇要根據實際業務場景來肯定。

若是錯將平級槽採用依賴槽關係來管理，就會出現信息的丟失。好比 A、B、C，三者本爲平級槽關係，但卻將其用 A->B->C 的依賴槽關係來管理，那即使用戶問句中包含填寫 B、C 槽組的信息，也可能會因爲 A 槽組的未填寫而形成 B、C 槽組的填寫失敗。

若是錯將依賴槽採用平級槽的關係來管理，就會出現信息的冗餘，好比 A、B、C三者的關係爲 A、A1->B、A2->C，那即使用戶將值 A1 填入槽組 A 後，卻仍然須要向用戶詢問本不須要的 C 槽組的填寫信息。

上述兩種狀況屬於全平級槽關係與全依賴槽關係的特殊狀況，在實際的業務場景中，這兩種關係會是同時存在的，不一樣槽組間，既有平級槽關係，又有依賴槽關係。

實際業務場景中，完整的多輪對話過程一般會以樹的形式存在，每一個節點存在一個或多個槽組，用於獲取一種或多種信息，節點間的槽組爲依賴關係，節點內的槽組爲平級關係。

上文將多輪對話定義爲一件事情的處理，槽組/槽定義爲一種信息的獲取，槽位定義爲信息的一種獲取方式。這裏我傾向於將多輪對話樹結構中的一個節點定義爲處理事情的一個步驟。

一件事情的處理包含多個步驟，每一個步驟中須要補全一種或多種信息，每種信息存在一種或多種獲取方式。

上述定義和組裏算法大佬的定義有些分歧，不過誰讓這是個人文章呢：）就按個人來。

七、填槽意義

結合上文，咱們須要瞭解到，填槽的意義有兩個：做條件分支多輪對話、做信息補全用戶意圖。換言之，填槽不只是補全用戶意圖的方式，並且前序槽位的填寫還會起到指導後續信息補全走向的做用。

八、准入條件

上文咱們講到，完整的多輪對話過程一般會以樹的形式存在，樹中包含多個節點，表明處理這件事情的一個步驟。

而每一個節點，都應當有其特別的准入條件。樹的根節點每每須要限制 NLU 模塊的輸出，也即明確什麼樣的用戶意圖將會由該棵多輪對話樹來處理；樹的中間及葉子節點每每須要根據前序槽組的填槽結果以及其餘背景信息進行條件限制。（若是將全部信息，好比 NLU 模塊輸出，或是其餘背景信息都看作前序槽組的填寫結果，那就能獲得統一的槽組-條件-槽組-條件······形式，槽組用於獲取信息，條件用於信息限制）

我嘗試從兩個角度來描述一套完備的准入條件體系。

一個是多條件的組織形式，准入條件在邏輯上應該支持條件間的與或非，百度的 UNIT 平臺提供了一種相對成熟的組織形式，將准入條件總體劃分爲條件和條件組，條件包含在條件組中，組內條件間是且關係，條件組之間是或關係（固然這裏的且與或能夠根據自身業務狀況對調），條件自己支持非關係。

一個是單條件的限制能力，准入條件應當同時支持對前序槽組填寫值、填寫方式、填寫狀態進行限制。也即須要有針對值的條件、針對類型的條件和針對狀態的條件。簡單的講，狀態就是『填了嗎』，類型就是『誰填的』，值就是『填了什麼』。

不一樣業務場景下咱們會須要不一樣角度的限制條件。好比，上文中提到填槽的意義包含兩種：做條件分支多輪對話、做信息補全用戶意圖，若是僅僅做信息，那咱們一般就只關心『填了嗎』，只要填寫完成就進行後續步驟，並不關係『誰填的』以及『填了什麼』；可是若是槽組內的填入值會影響後續多輪對話走向，那咱們就傾向於經過槽組的填入方式或填入值來做多輪對話的分支。

3、答案系統、話題切換和狀態切換

1）答案系統

先明確一個觀點，多輪對話樹的節點屬於對話節點而不是答案節點，同一份答案可能會出如今多個對話節點中。

答案系統和多輪過程應當是解耦的，答案系統中的每份答案都應當設置好本身的觸發條件。舉個例子，若存在 ABC 三個槽，A=A一、B=B三、C=C1 提供答案一，A=A二、B=B一、C=C2 或 A=A三、B=B二、C=C1 提供答案二。

另外，答案的種類也不該僅侷限於文本，富文本、接口、話題切換，均可以視爲合理的答案形式。

2）話題切換

話題切換指用戶與用戶的對話從一個多輪過程切換至另外一個多輪過程，話題切換有主動切換和被動切換之分。

上文提到的做爲答案的話題切換，就能夠理解爲主動的話題切換。

被動的話題切換是指，系統發現沒法從用戶的問句中抽取信息以繼續當前的多輪對話，只好將其做爲一條全新的問句從新進行解析和話題識別。

話題切換，尤爲是主動的話題切換會涉及到一個新問題：槽繼承。舉個例子——

我：『我明天要坐高鐵從杭州到北京』

我：『算了，仍是坐飛機吧』

這種狀況下，機器人不該當重複詢問『出發地』、『出發時間』和『目的地』。

除了槽繼承，還有一個與之相對的問題叫作槽記憶，這一般適用在被動式的話題切換中。因爲解析失誤，或者其餘緣由，使得用戶跳出了原話題，當用戶在必定時間內從新回到原話題時，不該讓用戶重複進行填槽，該技術已被用於阿里小蜜，不過他們彷佛稱之爲『多輪狀態記憶』。

舉個例子——

我：幫我訂張從杭州到北京的機票。

VPA：請問您但願哪天出發呢？

我：明天杭州下雨嗎？

VPA：明天杭州有雷陣雨。

我：後天呢？

VPA：後天杭州天氣晴。

我：機票訂後天的。

VPA：好的，已幫你預約後天從杭州到北京的機票。

三、狀態切換

咱們還須要思考這樣一個問題，既然話題能夠切換，也即一個多輪過程能夠切換到另外一個多輪過程，那多輪過程當中的對話狀態是否能夠切換？

我舉兩個例子——

第一個：

我：幫我訂張機票，從杭州出發。

VPA：請問你想去哪呢？

我：（發現明天杭州有雷陣雨）換出發地。

VPA：請問你想從哪出發呢？

我：上海。

多輪對話應當容許回到前序節點。

第二個：

我：我想買個杯子。

VPA：如下是爲您推薦的杯子。（展現結果一）

我：換一換。

VPA：如下是爲您推薦的杯子。（展現結果二）

多輪對話應當容許重複進入同一節點。

結語

就先這麼多吧：）

注，飯糰「AI產品經理大本營」，是黃釗hanniman創建的、行業內第一個「AI產品經理成長交流社區」，經過天天干貨分享、每個月線下交流、每季職位內推等方式，幫助你們完成「AI產品經理成長的實操路徑」。

---------------------

做者：黃釗hanniman，圖靈機器人-人才戰略官，前騰訊產品經理，5年AI實戰經驗，8年互聯網背景，微信公衆號/知乎/在行ID「hanniman」，飯糰「AI產品經理大本營」，分享人工智能相關原創乾貨，200頁PPT《人工智能產品經理的新起點》被業內普遍好評，下載量1萬+。

檢索式chatbot：word2vec/GloVe/fasttext

1. 掃盲

2. 檢索式模型的套路

深度學習模型復現難？看看這篇句子對模型的復現論文

同媒體快訊

相關快訊

NLP︱高級詞向量表達（一）——GloVe（理論、相關測評結果、R&python實現、相關應用）

高級詞向量三部曲：

1、理論簡述

一、word2vec

二、GloVe

2、測評

一、詞向量測評方法

二、測評結果

三、利用詞向量解決歧義問題

3、Glove實現&R&python

一、Glove訓練參數

二、用R&python實現

4、相關應用

一、glove+LSTM：命名實體識別

二、PAPER：詞向量的擦除進行情感分類、錯誤稽查

NLP︱高級詞向量表達（二）——FastText（簡述、學習筆記）

高級詞向量三部曲：

如何在python 很是簡單訓練FastText，可見筆者博客：

1、FastText架構

一、fastText 架構原理

..二、改善運算效率——softmax層級

2、FastText的詞向量表徵

一、FastText的N-gram特徵

三、FastText詞向量與word2vec對比

3、FastText實現

.延伸一：重磅：facebook公開了90種語言的Pre-trained word vectors

NLP︱高級詞向量表達（三）——WordRank（簡述）

一、wordRank，與 word2vec、fastText三者對比

二、wordRank，與 word2vec、GloVe三者對比

高級詞向量三部曲：

應用

方法

傳統方法

分類流程

文本預處理

文本表示

特徵權重計算

特徵選擇

深度學習方法

3. 論文串燒

必需要提的：Multi-view model

一次大大的進化：SMN model

utterance也要深度encoding！DUA model

state-of-the-art：DAM model

總結

填槽與多輪對話 | AI產品經理須要瞭解的AI技術概念

序言

1、多輪對話

2、槽

3、答案系統、話題切換和狀態切換

結語

.
.
二、改善運算效率——softmax層級

.
延伸一：重磅：facebook公開了90種語言的Pre-trained word vectors