#Datawhale_NLP Task01賽題理解

賽題理解 賽題數據爲新聞文本,並按照字符級別進行匿名處理。整合劃分出14個候選分類類別:財經、彩票、房產、股票、家居、教育、科技、社會、時尚、時政、體育、星座、遊戲、娛樂的文本數據。 賽題數據由以下幾個部分構成: 訓練集20w條樣本 測試集A包括5w條樣本 測試集B包括5w條樣本 問題 不太明白按照字符級別進行匿名處理是什麼意思? 任務:訓練分類器 目標是把訓練集中20萬的文本儘可能精確地歸爲14
相關文章
相關標籤/搜索