零基礎入門NLP - 新聞文本分類(賽題理解)

本文是零基礎入門NLP - 新聞文本分類的第一篇作業,定位是對賽題的精簡和解題思路開拓。 讀題 任務 新聞文本分類。 數據解析 賽題數據爲新聞文本,並按照字符級別進行匿名處理。 數據類別爲14種:財經、**、房產、股票、家居、教育、科技、社會、時尚、時政、體育、星座、遊戲、娛樂的文本數據。 數據量:訓練集20w條樣本,測試集A包括5w條樣本,測試集B包括5w條樣本。 模型評價 評價標準爲類別 F
相關文章
相關標籤/搜索