(早前的一個智能聊天機器人設計,實際使用中已經改了不少了。)併發
簡述
主要分三塊:框架
- SuperRobot 框架主體。
- 天然語言理解系統。
- 詞向量Trainer。
SuperRobot
- AliceBot負責閒聊,採用AIML Engine,屬於rulebased。
- 閒聊語句經過後臺輸入到DB。
- ServiceBot負責業務QA,Matcher負責匹配工做。
- 自定義QA對經過後臺輸入到DB。
- AbilityBot負責與第三方系統交互,經過REST請求天然語言理解系統返回意圖及實體。
- 後臺能定義交互的服務接口。
- 用Java開發。
天然語言理解系統
- 主要負責的工做時意圖預測和實體識別。
- 須要標註業務數據樣本的實體和意圖。
- 實體提取器經過序列標註訓練模型並實現實體提取。
- 意圖分類器經過SVM訓練模型並實現意圖預測。
- 麻省理工NLP工具MITIE。
- 用Python、C++ 開發。
詞向量Trainer
- 主要負責詞向量訓練。
- 普通語料包括維基百科百度百科。
- 業務語料包括業務系統數據。
- 用DLib機器學習庫。
- 用C++開發。
- 訓練的模型供前面使用。
-------------推薦閱讀------------機器學習
個人2017文章彙總——機器學習篇分佈式
個人2017文章彙總——Java及中間件工具
個人2017文章彙總——深度學習篇學習
個人2017文章彙總——JDK源碼篇.net
個人2017文章彙總——天然語言處理篇設計
個人2017文章彙總——Java併發篇cdn
------------------廣告時間----------------中間件
公衆號的菜單已分爲「分佈式」、「機器學習」、「深度學習」、「NLP」、「Java深度」、「Java併發核心」、「JDK源碼」、「Tomcat內核」等,可能有一款適合你的胃口。
鄙人的新書《Tomcat內核設計剖析》已經在京東銷售了,有須要的朋友能夠購買。感謝各位朋友。
爲何寫《Tomcat內核設計剖析》
歡迎關注: