文本分類實戰----數據處理篇

最近在參加kaggle上的一個文本分類的比賽,因爲持續時間比較長,有兩個月的時間,想在這期間詳細的學習一下文本分類的方法和知識,所以會持續更新一些博客來記錄參賽的過程。在比賽結束後,我會將參賽過程中使用的代碼放到我的Github上面,大家相互學習。主要會包括如何處理數據,參賽中使用的模型,一些重要方法的原理等方面的東西。本篇主要記錄數據的處理方法。 任務介紹 首先我們介紹一下這個比賽的任務,是對輸
相關文章
相關標籤/搜索