幾大智能語義平臺調研

幾個平臺

這次主要是調研瞭如下五家智能語義平臺:git

  1. 阿里雲小蜜(beebot) www.aliyun.com/product/beebot
  2. 百度度祕(DuerOS)dueros.baidu.com
  3. 騰訊文智中文語義平臺(xiaowei) xiaowei.qcloud.com
  4. 微軟智能天然語言理解平臺(luis) www.luis.ai

平臺概況

image


機器人包含的場景

beebot

雲小蜜是一款面向開發者的會話機器人,支持在不一樣的消息端上實現基於天然語言處理(NLP)的智能會話。包含如下經常使用領域:算法

  1. 公司採購
  2. 辦公軟件系統
  3. 辦事指南
  4. 報銷政策
  5. 職業發展
  6. 發票知識
  7. 基礎行政
  8. 公司設施

DuerOS

百度的DuerOS並不只僅只是提供簡單的機器人,而更像是一個操做系統,提供了軟件和硬件的各類接口開發。主要有三大類:json

  1. 自定義技能,提供了一個平臺能夠本身定義技能,自定義意圖和詞典,對用戶的輸入進行意圖識別,而後調用意圖對應的服務,實現對話式技能。好比輸入語言「幫我查查附近美食」,對應意圖爲「查找美食」,對應的服務接口是「www.xxx.xxx/search」 ,則查到結果後返回給用戶。
  2. 智能家居技能,這個技能主要是面對智能設備廠商的技能,能夠很方便對接智能家居。將用戶說的話或者文本輸入轉到對應操做上。
  3. 內容播報技能,主要爲內容生產者定製,好比將須要播報的信息文本上傳,而後用戶就能夠點播文本新聞或語音新聞。

xiaowei

小微客戶機器人適用場景:用戶導入業務領域知識庫信息,創建機器人知識信息基礎。api

  1. 家庭場景,家庭內帶屏幕設備接入實現對話交互。
  2. 車載場景,語音與汽車而結合,達到控制導航、音樂播放等語言交互。
  3. 運動場景,語音喚醒耳機及APP,實現互動。

luis

  1. 出租車領域,出租車預約之類的意圖。
  2. 地點領域,包括了各類地點相關意圖。
  3. 天氣領域,包括天氣報告和預測意圖。
  4. 提醒領域,包括提醒功能的建立、修改和查詢意圖。
  5. 日程領域,包括日程主題相關的規劃管理意圖。
  6. 智能家居領域,提供控制燈光、家電等操做意圖。
  7. 筆記領域,提供筆記建立、查詢和修改等操做意圖。
  8. 網頁導航領域,提供網頁導航相關的功能意圖。
  9. 翻譯領域,提供翻譯語言相關的意圖。
  10. 設備控制領域,包括控制設備的意圖。
  11. 通信領域,提供與電話、電子郵件等相關的意圖。
  12. 音樂領域,提供與音樂播放相關的意圖。
  13. 餐廳領域,提供餐廳預約意圖。

如何使用

beebot

  1. 註冊阿里雲帳號並登錄。
  2. 建立機器人並配置機器人基本信息。
  3. 選擇須要內置的領域知識,其中包括公司採購、辦公軟件系統、辦事指南、報銷政策、基礎行政、職業發展、發票知識等等。
  4. 管理知識庫,新增詞條。
  5. 添加詞條關聯問題,當用戶輸入的問題匹配到詞條時會展現關聯的問題。
  6. 自定義意圖,而且輸入該意圖用戶可能的多種問法。
  7. 標註實體,對用戶問法語句中相關的實體進行標註。
  8. 配置用戶回覆是否以文本回復,仍是配置到咱們本身的服務接口上處理後再返回給用戶。
  9. 上線發佈。

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

DuerOS

  1. 註冊百度帳戶,而後登錄。
  2. 到後臺建立本身的意圖,其中包括了意圖名、常見表達語句(及哪些語句對應到該意圖)、表達語句的槽位、技能回覆(這裏包括自定義回覆和服務配置知足兩種類別,自定義回覆便是本身將文本答案填進去,而服務配置知足則是duer會將意圖識別後的數據轉發到咱們的服務器接口上,咱們再本身處理)。另外,還能夠定義多輪對話,但每輪對話都要咱們本身設計好。
  3. 建立本身的詞典,有不少內置的詞典能夠用,包括國家、中國城市、中國省份、區/縣/郡、村莊/鄉鎮、顏色、動物、國外城市、景點、節日、電影、音樂、名人、植物、電視連續劇、綜藝節目、公交、地鐵、成語、百家姓、品牌等等。
  4. 開始訓練,DuerOS會幫咱們生成不少不一樣的語句表達,好比咱們定義的是「介紹下電信套餐」,它會生成幾十條相似的問法,「說明下電信套餐」、「簡介下電信套餐」等之類的,但其中標註工做也仍是得咱們本身作,就是要給這幾十條生成的相似問題的語句進行標註。
  5. 配置服務接口信息。
  6. 測試,發佈。

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

xiaowei

  1. 註冊騰訊雲並登錄。
  2. 申請小微機器人。
  3. 建立機器人。
  4. 上傳知識庫。
  5. 配置服務接口。
  6. 建立意圖,同時配置槽位。
  7. 訓練。
  8. 上線。

luis

  1. 微軟帳號登錄。
  2. 建立一個app,其中會有culture選擇,它包含了不少國家能夠選擇,根據不一樣國家文化理解語言文字。
  3. 能夠選擇本身須要的領域,領域包含了不少意圖,每一個意圖包含了不少提問。
  4. 建立意圖,根據本身業務須要本身定義意圖。
  5. 建立實體,實體能夠用來對問題進行序列標註。
  6. 一條條添加業務問題,便是常見的業務諮詢語句。
  7. 將每一個業務問題諮詢語句中相關的實體標出來,後續訓練後用於實體提取。
  8. 開始訓練模型。
  9. 完成訓練,開始使用模型預測意圖及實體提取。
  10. 發佈模型,使用提供的url接口進行訪問。

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

集成方式

beebot

  1. HTTP協議的API接口。
https://chatbot.cn-shanghai.aliyuncs.com/
?Format=xml
&Version=2017-10-11
&Signature=Pc5WB8gokVn0xfeu%2FZV%2BiNM1dgI%3D 
&SignatureMethod=HMAC-SHA1
&SignatureNonce=15215528852396
&SignatureVersion=1.0
&AccessKeyId=key-test
&Timestamp=2017-10-11T12:00:00Z
複製代碼
<?xml version="1.0" encoding="UTF-8"?> 
<!—結果的根結點-->
<接口名稱+Response>
    <!—返回請求標籤-->
    <RequestId>4C467B38-3910-447D-87BC-AC049166F216</RequestId>
    <!—返回結果數據-->
</接口名稱+Response>
複製代碼

DuerOS

  1. HTTP協議接口。
  2. 服務端SDK方式,支持PHP。
  3. 安卓SDK。
{
  "event": {
    "header": {
      "namespace": "ai.dueros.device_interface.text_input",
      "name": "TextInput",
      "messageId": "f894055e-a81e-4b4d-a97e-72c4d3a9ada4",
      "dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3"
    },
    "payload": {
      "query": "介紹下電信套餐"
    }
  },
  "clientContext": [
    {
      "header": {
        "namespace": "ai.dueros.device_interface.location",
        "name": "GpsState"
      },
      "payload": {
        "longitude": null,
        "latitude": null,
        "geoCoordinateSystem": "BD09LL"
      }
    }
  ],
  "debug": {
    "bot": {
      "id": "ec773bfc-f907-bfae-160b-b6ec2250fd5d"
    },
    "simulator": true
  }
}

複製代碼
{
  "directive": {
    "header": {
      "namespace": "ai.dueros.device_interface.screen",
      "name": "RenderCard",
      "dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3",
      "messageId": "NWE3MTNmMmU1ZWJiZTE0NTE="
    },
    "payload": {
      "type": "TextCard",
      "content": "請問套餐編號是什麼?",
      "token": "eyJib3RfaWQiOiJ1cyIsInJlc3VsdF90b2tlbiI6IjBhYTU3MGM0LWNhODQtNGEzYS05NmM2LTBkOTAwM2Y3YjcyNSIsImJvdF90b2tlbiI6Im51bGwifQ=="
    }
  }
}

複製代碼

xiaowei

  1. Rest API
https://yun.tim.qq.com/v3/prophet/$command?appid=$appid&sdkappid=$sdkappid&identifier=$identifier&usersig=$usersig&random=999999&contenttype=json
複製代碼
{
    "botid": "third party account", 
    "auth": "", 
    "from_user_name": "小明", 
    "question": "發送消息失敗", 
    "max_answer_num": 10
}
複製代碼

luis

只提供url接口,全部應用本身經過http協議進行訪問。好比下面的訪問,系統會返回一串json格式報文,其中包括各類意圖的可能性得分,還有提取到的實體。瀏覽器

westus.api.cognitive.microsoft.com/luis/v2.0/a…bash

{
  "query": "有沒有流量包月套餐",
  "topScoringIntent": {
    "intent": "電信業務諮詢",
    "score": 0.9712404
  },
  "intents": [
    {
      "intent": "電信業務諮詢",
      "score": 0.9712404
    },
    {
      "intent": "None",
      "score": 0.2136391
    },
    {
      "intent": "查找餐館",
      "score": 0.0577361658
    }
  ],
  "entities": [
    {
      "entity": "包月套餐",
      "type": "套餐",
      "startIndex": 5,
      "endIndex": 8,
      "score": 0.832137644
    }
  ]
}
複製代碼

總結

  • 關於數據量,都是須要本身去添加定義大量業務問題。
  • 關於訓練,luis則須要本身對添加的業務問題進行訓練,而後才能使用模型,並且應該是在瀏覽器上執行訓練,這樣節省了他們服務器資源。
  • 關於效果,會有以下效果,「有沒有流量包月套餐」和「餐有量包沒流有月套」效果是同樣的。
  • 關於平臺方式,都提供了相似的後臺給用戶本身添加業務問題,以此將本身抽離出來。
  • 關於多輪對話,兩個平臺都只提供一問一答形式,不支持多輪對話。
  • 關於對話多樣性,兩個平臺都須要本身對一個問題添加多個回覆,以此實現多樣性,但這種方式也是比較生硬。
  • 關於bat的語義平臺,它們基本都是提供一個意圖識別以及對接服務的平臺,讓開發者本身配置各類意圖及表達,幫用戶的表達理解後轉發到直接的服務接口上。其中也涉及大量業務數據添加及標註工做,但它內部集成了一些通用模塊,並且根據開發者輸入的表達生成了更多相似的語句問法,能包含更多類型的提問,但生成的語句仍是須要咱們本身去標註。

專一於人工智能、讀書與感想、聊聊數學、計算機科學、分佈式、機器學習、深度學習、天然語言處理、算法與數據結構、Java深度、Tomcat內核等。服務器

相關文章
相關標籤/搜索