【爬蟲+文本分類】--新浪各種新聞標題,並用各種算法進行文本分類

本身設計的小項目,初始想法很簡單,檢驗本身爬蟲和nlp基本技能(分詞、詞向量(tokenize\onehot\tfidf\word2vec))和各種算法(樸素貝葉斯、svm、CNN、LSTM)掌握狀況,進一步查漏補缺,提高工程能力和算法應用能力:) **web 第一部分:爬蟲 ** 分析新浪網各種新聞網頁結構,應用requests庫,爬取並解析新浪各種新聞,包括汽車、教育、金融、娛樂、體育、科技共
相關文章
相關標籤/搜索