如何判斷一個對話機器人有多智能?

前言微信

隨着智能對話技術的發展,對話機器人愈來愈多地出如今人們的平常工做和生活中。從企業的角度,在合適的業務場景中使用對話機器人,可以極大地提高服務效率和用戶體驗。所以,引入對話機器人逐漸成爲每一個企業數字化和智能化轉型過程當中的重要戰略ide

那麼,咱們應該如何來評判一個對話機器人的能力,或者更具體一點,如何判斷一個對話機器人的智能程度呢?本文介紹一種對話機器人的分級,讓咱們能夠更清楚地瞭解不一樣等級的對話機器人分別具備什麼能力,適用於什麼場景網站

1、對話機器人的分級ui

目前業界並無一個成熟的對話機器人分級體系,但自動駕駛的分級可以給咱們一些啓發。根據行業標準,自動駕駛能力被分爲L1到L5共5個等級(L0表明徹底人類駕駛,不算在5個等級以內),等級越高表明自動駕駛能力越強。好比,L1表明輔助駕駛,L5表明徹底自動駕駛。在不一樣的級別下,駕駛員和車輛所扮演的角色有所不一樣,級別越高駕駛員須要對車輛的控制越少(以下圖所示)。
圖片來源【1】spa

圖片來源 \[1\]

參考國外開發者社區對於智能助手的分級 [2],咱們從對話機器人可以解決的問題及其應用場景出發,將對話機器人的能力也進行分級,分爲L1到L5共5個等級等級越高表明對話機器人的能力越強(以下圖所示)。下面咱們分別介紹這5個等級。 3d

等級.png

## L1 單向推送code

機器人可向用戶推送消息,但沒有對話能力。blog

L1級別的對話機器人,只具有向用戶單向推送的能力。今天,咱們所使用的App、微信公衆號都會使用這種方式與用戶交互。這種方式的好處是受衆廣,效率高,缺點是用戶只能被動接收推送,沒法和機器人進行對話交互。所以,L1級別的機器人在嚴格意義上不能被稱爲「對話機器人」。圖片

L2單輪問答開發

機器人能回答用戶的常見問題,但沒有上下文理解能力,沒法主動與用戶交互。

L2級別的對話機器人開始具有對話交互能力,具體體如今它可以回答用戶的常見問題,最典型的應用場景是簡單的問答型客服機器人,即用戶問一個問題,機器人回答答案。這類對話機器人一般基於一個特定的知識庫,當用戶提出問題後,機器人須要對用戶的問題進行語義理解,並從知識庫中找到對應的答案回覆給用戶。
所以,評價L2級別對話機器人的效果,主要看召回率和準確率這兩項指標。其中,召回率等於有多少用戶的問題可以被機器人回答,準確率等於機器人回答的問題中有多少回答正確。關於L2級別對話機器人背後使用的技術,感興趣的讀者能夠閱讀以前的文章《揭祕:對話機器人平臺智能問答技術》。
綜合來看,L2級別的對話機器人適合比較簡單的客服場景,機器人能準確回答用戶的問題用戶問完即走

L3多輪對話

機器人能理解上下文,和用戶進行多輪對話,幫用戶完成任務。

L2級別的對話機器人通過訓練後雖然可以準確地回答用戶的問題,但仍然存在兩個明顯的缺陷。首先,它沒有上下文理解的能力,即機器人在回答一個用戶問題時,不會考慮用戶以前所說的內容。其次,它只能被動地回答用戶的問題,沒法主動發起與用戶交互,致使機器人的應用場景相對受限。
所以,咱們須要更加智能的L3級別對話機器人。咱們以快遞領域的客服機器人爲例,經過兩個具體的例子來講明L3級別對話機器人和L2級別的差異。

L2級別對話機器人沒法理解上下文.png
▲L2級別對話機器人沒法理解上下文

由於缺乏上下文理解能力,當用戶問「星期天開門嗎」時,缺乏了主語  「中關村的門店」,L2級別的對話機器人沒法理解用戶實際上是在問「中關村的自提點星期天開門嗎」,致使機器人沒法回答這個問題。對於L3級別的對話機器人,它可以理解上下文,從而補全了用戶問題的主語,這樣一來即可以回答出這個問題。

L3級別對話機器人可以理解上下文.png

L3級別對話機器人可以理解上下文

有些時候,機器人在知足用戶需求時,不只要聽懂用戶在說什麼,還須要主動向用戶發問,來獲取相關的信息。咱們來看另外一個例子。

​L2級別對話機器人可以回答問題,但沒法解決問題.png

L2級別對話機器人可以回答問題,但沒法解決問題

上面的例子中,在機器人回覆的消息裏,預定取件」是一個可點擊的連接,須要用戶點擊後在一個新的圖形化用戶界面(GUI, Graphical User Interface)中輸入取件時間、取件地址、取件電話等信息完成預定取件,這種須要在CUI和GUI之間來回切換的交互方式顯然不夠高效。

L2級別的對話機器人之因此要這樣,對話機器人並不知道取件時間、取件地址、取件電話等信息,沒有這些信息的狀況下,機器人只能提供一個連接讓用戶本身操做。也就是說,L2級別的對話機器人有時候雖然回答了用戶的問題,但並無真正幫用戶解決問題

理想狀況下,咱們但願機器人可以經過對話直接幫助用戶完成任務,這要求機器人可以經過多輪對話去理解和澄清用戶的意圖

L3級別對話機器人經過多輪對話解決用戶問題.png

L3級別對話機器人經過多輪對話解決用戶問題

綜上所述,L3級別對話機器人的核心能力有兩點,第一是可以理解上下文,第二是可以經過主動交互澄清用戶意圖,並經過多輪對話幫助用戶完成任務。所以,在準確率和召回率以外,任務完成率是L3對話機器人的重要指標

所以,L3級別的對話機器人適合更加複雜的業務場景,尤爲是須要機器人經過主動對話收集用戶信息的場景,例如營銷獲客等。

L4個性化對話

機器人能基於用戶標籤,爲用戶提供個性化的對話體驗。

理想狀況下,對話機器人在和用戶交互時,不只須要理解用戶在說什麼,也須要知道用戶是誰。具體而言,機器人能夠基於用戶標籤,即用戶的屬性、興趣等,爲用戶提供更個性化的對話體驗,也提高交互的效率。咱們繼續以預定上門取件爲例,L4級別的對話機器人會以這樣的方式來進行對話。

L4級別對話機器人基於用戶標籤提高對話效率.png

L4級別對話機器人基於用戶標籤提高對話效率

上面的例子中,機器人曾經服務過這個用戶,因此它已經記錄了用戶的取件地址和取件電話。在此次對話中,機器人無需再向用戶詢問取件地址、取件時間、取件電話,大大提高了交互效率和用戶體驗

對於L4級別的對話機器人,其核心在於可以爲用戶打標籤,並在對話過程當中靈活使用用戶標籤來提高對話效率和體驗。固然,若是個性化的對話體驗若是處理得不恰當,可能會給用戶帶來困擾,甚至傷害用戶的體驗。所以,對於L4級別的對話機器人,用戶滿意度是一個很是重要的指標。

所以,L4級別的對話機器人則更適合機器人和用戶保持長期關係的場景,例如智能助手等。

L5多機器人協做

多機器人相互協做,知足更復雜的用戶需求。

在某些狀況下,用戶的需求沒法被單一的對話機器人知足。以預訂餐廳爲例,用戶能夠對一個智能助手說出需求,智能助手經過對話的方式收集到了用戶要訂哪家餐廳、什麼時間、就餐人數等信息。此時,智能助手須要再調動另外一個電話機器人給餐廳打電話進行預訂。咱們能夠發現,這個需求的知足過程涉及到智能助手和電話機器人這兩個對話機器人的協做,將來會有更多的場景和需求須要多機器人協做

另外一方面,對話機器人只是一種形態的智能機器人,還有更多種不一樣類型的智能機器人。好比,機器人流程自動化(RPA)就是一種可以控制軟件自動完成特定任務流程的機器人。對話機器人和RPA機器人也有不少能夠結合的場景。仍是回到預訂餐廳的例子,若是餐廳提供在線預訂的網站,那麼能夠由對話機器人完成信息的收集,由RPA機器人完成預訂的操做。

2、吾來對話機器人平臺

吾來是一個提供擁有對話能力機器人開放平臺,定位於提供L2到L4級別的對話機器人能力。不管是企業仍是我的用戶,均可以根據本身的業務場景,使用由吾來提供的L2到L4級別的對話能力,來提高交互的效率和體驗。將來,咱們會分享更多圍繞吾來對話機器人平臺的產品理念、技術方案、真實案例,幫助須要對話機器人的企業或我的快速擁有屬於本身的對話機器人

注:

[1] SAE關於自動駕駛的分級,瞭解一下?網址爲「http://www.lilunpai.com/w/466

[2] Conversational AI: Your Guide to Five Levels of AI Assistants in Enterprise. 網址爲「https://blog.rasa.com/convers...

更多內容請關注微信公衆號【吾來對話機器人】

相關文章
相關標籤/搜索