天池NLP新聞文本分類學習賽心得-Task2

天池NLP新聞文本分類學習賽心得-Task2 賽題鏈接:https://tianchi.aliyun.com/competition/entrance/531810/introduction 今天按照昨天的存儲方法後,再次讀取數據相比昨天耗時就小的多了,並對文本數據進行初步處理及分析。 先來探究每條文本長度分佈如何: 可以看到總共統計了20w條文本數據記錄,其中最長的有57921個字符,最短的只有
相關文章
相關標籤/搜索