JavaShuo
欄目
標籤
【論文翻譯】2020.8 清華大學AI課題組——大型中文短文本對話數據集(A Large-Scale Chinese Short-Text Conversation Dataset)
時間 2021-01-13
標籤
NLP研究筆記
自然語言處理
欄目
CSS
简体版
原文
原文鏈接
大型中文短文本對話數據集 寫在前面:研究用,原創翻譯,轉載請標明出處;第一次譯文,之後會跟進完善。 摘要 生成式對話的神經網絡模型在建立短文本對話模型方向上取得了可喜的結果。然而,通過訓練得到這樣的模型通常需要大規模高質量的對話語料,而這種語料是很難獲取的。在本文中,我們提供了大規模已清洗中文對話數據集LCCC,其中包含了基礎版本(680萬條語料)和大規模版本(共1200萬條語料)。我們使用一
>>阅读原文<<
相關文章
1.
ApacheCN 數據科學譯文集 2020.8
2.
中文機器翻譯數據集
3.
CRNN論文翻譯——中英文對照
4.
ResNet論文翻譯——中英文對照
5.
CTPN論文翻譯——中英文對照
6.
論文閱讀課5-DocRED: A Large-Scale Document-Level Relation Extraction Dataset(大規模文檔集關係提取數據集
7.
YOLOv4論文中文翻譯
8.
FastSpeech2論文中文翻譯
9.
GFS論文中文翻譯
10.
BBR論文中文翻譯
更多相關文章...
•
XSD 僅含文本
-
XML Schema 教程
•
C# 文本文件的讀寫
-
C#教程
•
Scala 中文亂碼解決
•
Kotlin學習(二)基本類型
相關標籤/搜索
論文翻譯
中文文檔
短文
好文翻譯
外文翻譯
文檔翻譯
全文翻譯
譯文
文學文娛
CSS
HTML
Docker命令大全
NoSQL教程
MySQL教程
文件系統
數據傳輸
數據庫
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
vs2019運行opencv圖片顯示代碼時,窗口亂碼
2.
app自動化 - 元素定位不到?別慌,看完你就能解決
3.
在Win8下用cisco ××× Client連接時報Reason 422錯誤的解決方法
4.
eclipse快速補全代碼
5.
Eclipse中Java/Html/Css/Jsp/JavaScript等代碼的格式化
6.
idea+spring boot +mabitys(wanglezapin)+mysql (1)
7.
勒索病毒發生變種 新文件名將帶有「.UIWIX」後綴
8.
【原創】Python 源文件編碼解讀
9.
iOS9企業部署分發問題深入瞭解與解決
10.
安裝pytorch報錯CondaHTTPError:******
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
ApacheCN 數據科學譯文集 2020.8
2.
中文機器翻譯數據集
3.
CRNN論文翻譯——中英文對照
4.
ResNet論文翻譯——中英文對照
5.
CTPN論文翻譯——中英文對照
6.
論文閱讀課5-DocRED: A Large-Scale Document-Level Relation Extraction Dataset(大規模文檔集關係提取數據集
7.
YOLOv4論文中文翻譯
8.
FastSpeech2論文中文翻譯
9.
GFS論文中文翻譯
10.
BBR論文中文翻譯
>>更多相關文章<<