閱讀理解模型html
李紀爲博士論文github
問答系統對話管理vim
揭祕阿里小蜜:基於檢索模型和生成模型相結合的聊天引擎 | PaperDaily #25工具
MSRA周明博士解讀:聊天機器人的三大引擎(視頻+PPT)學習
知識圖譜ui
NLP:人工智能的詩和遠方人工智能
京東團隊:智能對話系統綜述.net
Deep Language Modeling for Question Answering using Keras
http://blog.csdn.net/mmc2015/article/details/51643802
全球最精準天然語言解析器 SyntaxNet
https://www.oschina.net/p/syntaxnet
文本自動摘要工具 TextTeaser 開源
http://www.oschina.net/news/52981/textteaser-opensource
Automatic text summarizer
http://www.open-open.com/lib/view/open1456572939812.html
深度學習解決機器閱讀理解任務的研究進展
https://zhuanlan.zhihu.com/p/22671467
QA問答系統中的深度學習技術實現:
http://www.tuicool.com/articles/zyUreqM
TextTeaser:自動文本摘要算法開源
http://geek.csdn.net/news/detail/3010
百度閱讀理解數據集
閱讀是人類獲取知識的一個重要途徑,智能機器也須要具有閱讀理解能力以實現持續學習和進化。機器閱讀理解(Machine Reading Comprehension) 研究近年來受到普遍關注,任務一般定義爲:讓機器閱讀文本,而後回答和閱讀內容相關的問題。閱讀理解涉及到理解、推理、摘要等複雜技術,極具挑戰。
爲了促進閱讀理解技術的發展,百度發佈了大規模中文閱讀理解數據集DuReader。首批發布的數據集包含20萬來自百度搜索用戶的真實問題,100萬來自互聯網的真實文檔,以及42萬人工撰寫生成的優質答案。同時,數據集還標註了問題類型、實體和觀點等豐富信息,並提供開源基線系統和評測平臺。DuReader是迄今爲止最大的面向真實需求的中文閱讀理解數據集。但願該數據集的發佈爲閱讀理解研究提供有力支撐,加速天然語言理解和人工智能研究的發展。
數據集下載地址:https://ai.baidu.com/broad/subordinate?dataset=dureader
數據集介紹論文:https://arxiv.org/abs/1711.05073
開源基線系統: https://github.com/baidu/DuReader
歡迎學術界和工業界的同仁們基於該數據集進行閱讀理解相關研究!
除了閱讀理解數據集,百度AI公開數據集計劃BROAD(Baidu Research Open-Access Dataset)還發布了視頻和圖像數據集,更多數據集參見:https://ai.baidu.com/broad