JavaShuo
欄目
標籤
【論文翻譯】2020.8 清華大學AI課題組——大型中文短文本對話數據集(A Large-Scale Chinese Short-Text Conversation Dataset)
時間 2021-01-13
標籤
NLP研究筆記
自然語言處理
欄目
CSS
简体版
原文
原文鏈接
大型中文短文本對話數據集 寫在前面:研究用,原創翻譯,轉載請標明出處;第一次譯文,之後會跟進完善。 摘要 生成式對話的神經網絡模型在建立短文本對話模型方向上取得了可喜的結果。然而,通過訓練得到這樣的模型通常需要大規模高質量的對話語料,而這種語料是很難獲取的。在本文中,我們提供了大規模已清洗中文對話數據集LCCC,其中包含了基礎版本(680萬條語料)和大規模版本(共1200萬條語料)。我們使用一
>>阅读原文<<
相關文章
1.
ApacheCN 數據科學譯文集 2020.8
2.
中文機器翻譯數據集
3.
CRNN論文翻譯——中英文對照
4.
ResNet論文翻譯——中英文對照
5.
CTPN論文翻譯——中英文對照
6.
論文閱讀課5-DocRED: A Large-Scale Document-Level Relation Extraction Dataset(大規模文檔集關係提取數據集
7.
YOLOv4論文中文翻譯
8.
FastSpeech2論文中文翻譯
9.
GFS論文中文翻譯
10.
BBR論文中文翻譯
更多相關文章...
•
XSD 僅含文本
-
XML Schema 教程
•
C# 文本文件的讀寫
-
C#教程
•
Scala 中文亂碼解決
•
Kotlin學習(二)基本類型
相關標籤/搜索
論文翻譯
中文文檔
短文
好文翻譯
外文翻譯
文檔翻譯
全文翻譯
譯文
文學文娛
CSS
HTML
Docker命令大全
NoSQL教程
MySQL教程
文件系統
數據傳輸
數據庫
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
windows下配置opencv
2.
HED神經網
3.
win 10+ annaconda+opencv
4.
ORB-SLAM3系列-多地圖管理
5.
opencv報錯——(mtype == CV_8U || mtype == CV_8S)
6.
OpenCV計算機視覺學習(9)——圖像直方圖 & 直方圖均衡化
7.
【超詳細】深度學習原理與算法第1篇---前饋神經網絡,感知機,BP神經網絡
8.
Python數據預處理
9.
ArcGIS網絡概述
10.
數據清洗(三)------檢查數據邏輯錯誤
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
ApacheCN 數據科學譯文集 2020.8
2.
中文機器翻譯數據集
3.
CRNN論文翻譯——中英文對照
4.
ResNet論文翻譯——中英文對照
5.
CTPN論文翻譯——中英文對照
6.
論文閱讀課5-DocRED: A Large-Scale Document-Level Relation Extraction Dataset(大規模文檔集關係提取數據集
7.
YOLOv4論文中文翻譯
8.
FastSpeech2論文中文翻譯
9.
GFS論文中文翻譯
10.
BBR論文中文翻譯
>>更多相關文章<<