Datawhale | 自然語言處理(2)

文章目錄 一. THUCNews中文數據集 1.1 數據下載 1.2 數據探索 二. IMDB英文數據集 2.1 數據下載 2.2 數據探索 三. 常用評估方式 3.1 混淆矩陣 一. THUCNews中文數據集 THUCNews是根據新浪新聞RSS訂閱頻道2005~2011年間的歷史數據篩選過濾生成,包含74萬篇新聞文檔(2.19 GB),均爲UTF-8純文本格式。在原始新浪新聞分類體系的基礎上
相關文章
相關標籤/搜索