Datawhale零基礎入門NLP賽事-LUV

Datawhale零基礎入門NLP賽事-LUV 1.讀取數據集 2.每個句子平均由1035個字符構成,最短的長度爲51,最長的長度爲5844。 繪製直方圖 3.繪製直方圖 從統計結果可以看出,數據集類別分佈存在較爲不均勻的情況。在訓練集中科技類新聞最多,其次是股票類新聞,最少的新聞是星座新聞。
相關文章
相關標籤/搜索