前言:git
最近了解了一下Rasa,閱讀了一下官方文檔,初步搭建了一個聊天機器人。 github
官方文檔:https://rasa.com/docs/ 框架
搭建的chatbot項目地址: https://github.com/handsomecui/chat-robot.gitdom
Rasa介紹:
機器學習
Rasa Stack 開源機器學習工具,供開發人員建立上下文AI助手和聊天機器人,由 Rasa Core and NLU 組成。
rasa-nlu:用於天然語言理解的庫,具備意圖分類和實體提取
識別結構化數據,根據培訓數據瞭解用戶信息,能夠根據預約義意圖解釋意義。
rasa-core(DM):基於機器學習的對話管理的聊天機器人框架
基於NLU的輸入和歷史對話,訓練數據,Core決定接下來的對話內容。
項目簡介:
配置文件:
nlu_data.md 存放意圖以及對應的問法
stories.md和domain.md 存放故事情節以及實體,對應的輸出
主要依賴介紹:
Jieba
做用:中文分詞。
簡介:是一個強大的分詞庫,完美支持中文分詞。
Mitie
做用:信息抽取
簡介:它是一款免費且先進的信息抽取工具,目前包含了命名實體抽取、二元關係檢測功能,另外也提供了訓練自定義抽取器和關係檢測器的工具。
使用流程:
1.建立NLU實例
2.定義NLU模塊配置
3.訓練NLU模型
4.測試NLU模型
5.訓練使用Rasa Core輸出內容
6.定義Domain:意圖,行爲,模板
7.訓練對話模型
8.開始對話
後續擴展:
tensorflow,同義詞庫,爬數據訓練