智源&計算所-互聯網虛假新聞檢測挑戰賽

賽題的分析(Task 1): 一、任務:給定一個新聞事件的文本,斷定該事件屬於真實新聞仍是虛假新聞。 二、方法:訓練一個二分類器,判別新聞是真仍是假。 1、數據預處理: a、樣本數據觀察: 訓練集有38471條數據,每條數據有id、text、label三個字段,其中1表明正例 (真),0表明負例(假) b、數據清洗: 一、生成訓練詞向量的數據 二、去掉訓練樣本里的無心義的噪音,例如:url、@+人
相關文章
相關標籤/搜索