利用k-means、jieba、word2vec對交通事故原因進行聚類分析

  中文文本向量化 + 聚類分析 一、背景 因爲這段時間正好在和朋友準備比賽,賽題大概是基於交通事故的事故描述,進行文本多分類。實現將數據庫中已有的原因分類不明確的事故進行重分類,修復數據。也爲未來交警判責提供參考信息。 一直以來都沒有真正做過nlp方向的建模,藉此機會也把比賽過程記錄一下,一方面分享給有需要的朋友,另一方面也可以在以後能夠方便複習。也希望各位大佬可以指出不好的地方,讓小弟也能得到
相關文章
相關標籤/搜索