關於客服系統中的機器人算法
客服系統的興起是基於知足下降公司人力成本、維護精力的需求,一套客服系統的產品設計,上次有分享過史上最詳細的客服系統產品落地|後臺產品經理的工做實例,有那麼苦嗎?,但除了工單管理、客戶管理、以及客服系統的BI,其實最爲困難的就是如何提高客服系統的使用效率。
微信
就客服系統的使用效率,其根本就是是否可以爲企業下降人工服務的次數、仍共服務的時間佔比,甚至是提高公司的營業業績。在這裏面,我落地的客服系統其佔比最終的仍是機器人回答。app
【機器人問答的產品設計】學習
但機器人回答的發展期間,機器人的回答方式也在現在也是基於關鍵詞匹配與大數據結合的狀況下發展的。測試
【APP端機器人客服】大數據
【WEB端客服】網站
產品落地中,調研到目前國內的方法在中文分詞中,如今有三大分詞算法ui
第一類叫作基於字符串匹配的分詞方法
設計
第二類基於理解的分詞方法3d
第三類基於統計的分詞方法
相對於早起的純關鍵字匹配,如今國內的機器人也是基於NLP(天然語言處理技術也逐漸在興起),做爲PM的咱們,到底要如何去落地機器人問答系統?我談談個人案例分享
01知識庫的創建
若是說從0-1作客服系統,那麼機器人的模塊從一開始規劃中最爲重要的就是創建知識庫,這個知識庫的重要性在於之後的模型創建。
那麼問題來了,什麼是模型?
【對話模型】
平常生活中,咱們所知道的模型就至關因而一個模具,一個模具的能夠做爲一點,其製做更多產品,把模型作的越好、越精確,在量產中就會獲得更準確的結果。
更加精準、更加快速
那麼對話模型,就是咱們這裏提的一個模型。在不一樣行業中,咱們能夠知道起用戶發文的內容範圍、回答的範圍是不一樣的。
那麼如何訓練模型,簡單來講就是經過對話找到問題的答案,答案的問題
【問題與答案的訓練】
【答案與問題的訓練】
這裏提一個關鍵詞:語料
預料你能夠理解問一些詞庫,不過這個詞庫不一樣的是他會包含更多測試詞語、句子、符號等數據,而詞庫則是咱們知識庫中最爲關鍵的一個匹配詞庫。
既然要考慮模型和語料,咱們首先要考慮公司的業務是什麼?這就是所謂的特定領域,再到全局領域
目前這些語料都有網上的一些公開的包,PM能夠去下載瞭解下是否符合公司的業務。經過這些語料包,能夠去知道語氣詞、標點符號、違規敏感等
這裏從特意領域的語料,簡單舉個列子在金融證券行業,最爲關鍵的語料就是:公司產品名稱、股票名稱、公司名稱、經常使用服務名稱
這些都算語料裏面的詞庫,在一個公司創建知識庫中,我是按下圖進行分類組合
既然上面的邏輯關係清楚了,咱們能夠清楚知識庫是起着機器人回答的一個重要部分
【網易7魚】
從上面的圖能夠看到,其知識庫時候爲了分類管理,提供了一個分類管理的模塊,而且將問題與知識庫進行關聯。
【知識點與FAQ】
將問題匹配進入相應的知識點,機器人也須要知道諧音、或包含問題之外的其餘內容,如何去掉無效內容,匹配問題答案。
【類似詞庫】
創建類似詞庫的意義就是爲了方便機器人把類似處看做同義詞進行理解,把問題進行匹配。
在知識庫中添加問題與答案,咱們這裏落地首先要考慮問題與答案的對應關係。
也就是在對話模型中,一個問題是否會對應2個答案,一個答案是否會對應2個以上的問題?
【知識庫添加】
最好的方式是利用EXCEL文檔的方式整理,將文檔導入上傳。這裏我借鑑了一些客服系統的機器人中心文檔,將他們的文檔進行歸類,整理了以下模版
這樣的話,公司即便沒有客服系統,但經過平常的文檔歸類,也能夠快速的創建詞庫。
01
在產品設計中,這套系統仍是基於字符串匹配的算法。利用正相最大匹配、逆向最大匹配分、以及最小切分
那麼什麼是正向匹配算法?
正向最大匹配算法:從左到右將待分詞文本中的幾個連續字符與詞表匹配,若是匹配上,則切分出一個詞。
但這裏有一個問題:要作到最大匹配,並非第一次匹配到就能夠切分的 。咱們來舉個例子:
待分詞文本以下:
content[]={"產","品","經","理","從","此","站","起","來","了","。"}
詞表: dict[]={"產品", "產品經理" , "今後","站起來"}
這裏CONTENT[1]開始進行從左到右正向掃描,那麼掃描到第一個content[1],這個時候掃描的爲「產」字,掃描到第二個content[2],這個時候掃描到[產品];和dict[1]匹配上了,可是由於字數才2個字,須要爲3個字,就繼續這樣向下掃描。
循環處理,最終將詞語掃描出來。但這樣掃描出來的結果可能爲:產品/產品經理/從/此/站起/來,或產品/產品經理/從/此站起/來......
等結果,利用最小切詞,切詞的換算方式,但固然既然採用的是基於字符串匹配的分詞方法,其劣勢就在這裏,切分爲致使歧義問題。
所以咱們會把逆向最大匹配、正向最大匹配、最少分詞結果進行綜合匹配。最少分詞就是將針對正向、逆向的問題,將雙向切分的結果進行比較,選擇切分詞語數量較少的結果。
01
機器人在設置中,建議一開始沒有詞庫的時候,產品經理須要考慮一些基本詞庫,這些詞庫是公司名稱、公司產品、微信公衆號、網站地址等
【機器人初始化】
【機器人初始化】
這樣設計的理由很簡單,這是公司的基本問題或回答。在這套客服系統機器人是對外或甚至之後運營盈利狀況下,方便客戶首先設置好本身的基本機器人資料。
除了以上的機器人基本詞庫之外,還有機器人寒暄詞庫,而且產品設計中要對每個類型的詞庫回答進行限制。
好比當問了3個問題,都沒法匹配到機器人的答案,機器人應該以轉換人工的提醒方式或回答方式,讓用戶去尋找人工解決辦法。
【切換人工】
在當前的機器人系統中,在這個產品設計我一直定位該產品是輔助於人工客服去減小工做量,增長工做效率。機器人並不能徹底替代人工,因此時刻保持機器人與人工的切換,讓用戶可以得到好的解決體驗。
總結
在當下科技不斷髮展的時代,都說是AI的時代,從之前的大數據到現在的AI時代,智能機器客服系統就是典型的一個產品。
雖然對於PM來講,客服系統的難點在於如何去跑通公司客服業務流程,創建起一套好的服務流程。
1.分擔客服工做量
2.積累客服經驗,不斷完善問題庫
3.自定義機器人樣式,模擬人工聊天。
但難點也在於如何經過人工客服去積累學習更多的知識,以及經過數據渠道得到客服以及所在客戶行業的專業基礎知識。
我的微信574319420
微信公衆號:KEVIN改變世界的點滴