【達觀杯】數據競賽學習篇(一)

【任務1 - 數據初識】 下載數據 new_data.7z 解壓後包含2個csv文件:train_set.csv和test_set.csv 原文描述: train_set.csv:此數據集用於訓練模型,每一行對應一篇文章。文章分別在「字」和「詞」的級別上做了脫敏處理。共有四列: 第一列是文章的索引(id),第二列是文章正文在「字」級別上的表示,即字符相隔正文(article);第三列是在「詞」級別
相關文章
相關標籤/搜索