交通事故文本多分類——做一個快樂的調包俠

jieba+word2vec+GDBT+oneVsRestClassifier 一、背景 經過倆天的數據處理,現在勉強得到了1k+條事故描述-事故原因這種格式的數據,剩下的未處理的數據同組的小夥伴們還在加班加點的做,爲了不浪費時間,今天就先搭個殼子出來,看看初步效果。 二、數據預處理 和之前倆篇文章一樣,採取去停用詞、分詞、句子向量化等操作。 #導包 import numpy as np impo
相關文章
相關標籤/搜索