這次主要是調研瞭如下五家智能語義平臺:git
雲小蜜是一款面向開發者的會話機器人,支持在不一樣的消息端上實現基於天然語言處理(NLP)的智能會話。包含如下經常使用領域:算法
- 公司採購
- 辦公軟件系統
- 辦事指南
- 報銷政策
- 職業發展
- 發票知識
- 基礎行政
- 公司設施
百度的DuerOS並不只僅只是提供簡單的機器人,而更像是一個操做系統,提供了軟件和硬件的各類接口開發。主要有三大類:json
- 自定義技能,提供了一個平臺能夠本身定義技能,自定義意圖和詞典,對用戶的輸入進行意圖識別,而後調用意圖對應的服務,實現對話式技能。好比輸入語言「幫我查查附近美食」,對應意圖爲「查找美食」,對應的服務接口是「www.xxx.xxx/search」 ,則查到結果後返回給用戶。
- 智能家居技能,這個技能主要是面對智能設備廠商的技能,能夠很方便對接智能家居。將用戶說的話或者文本輸入轉到對應操做上。
- 內容播報技能,主要爲內容生產者定製,好比將須要播報的信息文本上傳,而後用戶就能夠點播文本新聞或語音新聞。
小微客戶機器人適用場景:用戶導入業務領域知識庫信息,創建機器人知識信息基礎。api
- 家庭場景,家庭內帶屏幕設備接入實現對話交互。
- 車載場景,語音與汽車而結合,達到控制導航、音樂播放等語言交互。
- 運動場景,語音喚醒耳機及APP,實現互動。
- 出租車領域,出租車預約之類的意圖。
- 地點領域,包括了各類地點相關意圖。
- 天氣領域,包括天氣報告和預測意圖。
- 提醒領域,包括提醒功能的建立、修改和查詢意圖。
- 日程領域,包括日程主題相關的規劃管理意圖。
- 智能家居領域,提供控制燈光、家電等操做意圖。
- 筆記領域,提供筆記建立、查詢和修改等操做意圖。
- 網頁導航領域,提供網頁導航相關的功能意圖。
- 翻譯領域,提供翻譯語言相關的意圖。
- 設備控制領域,包括控制設備的意圖。
- 通信領域,提供與電話、電子郵件等相關的意圖。
- 音樂領域,提供與音樂播放相關的意圖。
- 餐廳領域,提供餐廳預約意圖。
- 註冊阿里雲帳號並登錄。
- 建立機器人並配置機器人基本信息。
- 選擇須要內置的領域知識,其中包括公司採購、辦公軟件系統、辦事指南、報銷政策、基礎行政、職業發展、發票知識等等。
- 管理知識庫,新增詞條。
- 添加詞條關聯問題,當用戶輸入的問題匹配到詞條時會展現關聯的問題。
- 自定義意圖,而且輸入該意圖用戶可能的多種問法。
- 標註實體,對用戶問法語句中相關的實體進行標註。
- 配置用戶回覆是否以文本回復,仍是配置到咱們本身的服務接口上處理後再返回給用戶。
- 上線發佈。
- 註冊百度帳戶,而後登錄。
- 到後臺建立本身的意圖,其中包括了意圖名、常見表達語句(及哪些語句對應到該意圖)、表達語句的槽位、技能回覆(這裏包括自定義回覆和服務配置知足兩種類別,自定義回覆便是本身將文本答案填進去,而服務配置知足則是duer會將意圖識別後的數據轉發到咱們的服務器接口上,咱們再本身處理)。另外,還能夠定義多輪對話,但每輪對話都要咱們本身設計好。
- 建立本身的詞典,有不少內置的詞典能夠用,包括國家、中國城市、中國省份、區/縣/郡、村莊/鄉鎮、顏色、動物、國外城市、景點、節日、電影、音樂、名人、植物、電視連續劇、綜藝節目、公交、地鐵、成語、百家姓、品牌等等。
- 開始訓練,DuerOS會幫咱們生成不少不一樣的語句表達,好比咱們定義的是「介紹下電信套餐」,它會生成幾十條相似的問法,「說明下電信套餐」、「簡介下電信套餐」等之類的,但其中標註工做也仍是得咱們本身作,就是要給這幾十條生成的相似問題的語句進行標註。
- 配置服務接口信息。
- 測試,發佈。
- 註冊騰訊雲並登錄。
- 申請小微機器人。
- 建立機器人。
- 上傳知識庫。
- 配置服務接口。
- 建立意圖,同時配置槽位。
- 訓練。
- 上線。
- 微軟帳號登錄。
- 建立一個app,其中會有culture選擇,它包含了不少國家能夠選擇,根據不一樣國家文化理解語言文字。
- 能夠選擇本身須要的領域,領域包含了不少意圖,每一個意圖包含了不少提問。
- 建立意圖,根據本身業務須要本身定義意圖。
- 建立實體,實體能夠用來對問題進行序列標註。
- 一條條添加業務問題,便是常見的業務諮詢語句。
- 將每一個業務問題諮詢語句中相關的實體標出來,後續訓練後用於實體提取。
- 開始訓練模型。
- 完成訓練,開始使用模型預測意圖及實體提取。
- 發佈模型,使用提供的url接口進行訪問。
https://chatbot.cn-shanghai.aliyuncs.com/
?Format=xml
&Version=2017-10-11
&Signature=Pc5WB8gokVn0xfeu%2FZV%2BiNM1dgI%3D
&SignatureMethod=HMAC-SHA1
&SignatureNonce=15215528852396
&SignatureVersion=1.0
&AccessKeyId=key-test
&Timestamp=2017-10-11T12:00:00Z
複製代碼
<?xml version="1.0" encoding="UTF-8"?>
<!—結果的根結點-->
<接口名稱+Response>
<!—返回請求標籤-->
<RequestId>4C467B38-3910-447D-87BC-AC049166F216</RequestId>
<!—返回結果數據-->
</接口名稱+Response>
複製代碼
{
"event": {
"header": {
"namespace": "ai.dueros.device_interface.text_input",
"name": "TextInput",
"messageId": "f894055e-a81e-4b4d-a97e-72c4d3a9ada4",
"dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3"
},
"payload": {
"query": "介紹下電信套餐"
}
},
"clientContext": [
{
"header": {
"namespace": "ai.dueros.device_interface.location",
"name": "GpsState"
},
"payload": {
"longitude": null,
"latitude": null,
"geoCoordinateSystem": "BD09LL"
}
}
],
"debug": {
"bot": {
"id": "ec773bfc-f907-bfae-160b-b6ec2250fd5d"
},
"simulator": true
}
}
複製代碼
{
"directive": {
"header": {
"namespace": "ai.dueros.device_interface.screen",
"name": "RenderCard",
"dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3",
"messageId": "NWE3MTNmMmU1ZWJiZTE0NTE="
},
"payload": {
"type": "TextCard",
"content": "請問套餐編號是什麼?",
"token": "eyJib3RfaWQiOiJ1cyIsInJlc3VsdF90b2tlbiI6IjBhYTU3MGM0LWNhODQtNGEzYS05NmM2LTBkOTAwM2Y3YjcyNSIsImJvdF90b2tlbiI6Im51bGwifQ=="
}
}
}
複製代碼
https://yun.tim.qq.com/v3/prophet/$command?appid=$appid&sdkappid=$sdkappid&identifier=$identifier&usersig=$usersig&random=999999&contenttype=json
複製代碼
{
"botid": "third party account",
"auth": "",
"from_user_name": "小明",
"question": "發送消息失敗",
"max_answer_num": 10
}
複製代碼
只提供url接口,全部應用本身經過http協議進行訪問。好比下面的訪問,系統會返回一串json格式報文,其中包括各類意圖的可能性得分,還有提取到的實體。瀏覽器
westus.api.cognitive.microsoft.com/luis/v2.0/a…bash
{
"query": "有沒有流量包月套餐",
"topScoringIntent": {
"intent": "電信業務諮詢",
"score": 0.9712404
},
"intents": [
{
"intent": "電信業務諮詢",
"score": 0.9712404
},
{
"intent": "None",
"score": 0.2136391
},
{
"intent": "查找餐館",
"score": 0.0577361658
}
],
"entities": [
{
"entity": "包月套餐",
"type": "套餐",
"startIndex": 5,
"endIndex": 8,
"score": 0.832137644
}
]
}
複製代碼
專一於人工智能、讀書與感想、聊聊數學、計算機科學、分佈式、機器學習、深度學習、天然語言處理、算法與數據結構、Java深度、Tomcat內核等。服務器