數據挖掘篇: 使用決策樹識別Python招聘信息所屬類別(分支)

最近在分析Python招聘信息的數據, 使用職位描述分詞來判斷分類不是很精準, 於是打算使用分詞構造一個特徵, 然後使用決策樹來分類(下次試試聚類算法), 這樣誤差會小很對, 可以讓我們更加精準的完成一份高質量的數據報告. 首先看看原始數據吧 接下來我們要通過分詞和人工識別來構建專家樣本數據 注: 原計劃訓練數據至少2000條, 然後先人工識別了100條就忍不住想試一試 由於有20個特徵和4個分類
相關文章
相關標籤/搜索