爬取微博評論並提取主要關鍵詞(一)

    接到一個天然語言處理的任務,主要是爬取醫療行業微博評論並提取關鍵詞,順便分類。最終是要對這些評論進行自動回覆,給個人不過是初級任務,那麼我就拆解任務目標,一步一步來實現。      1、首先實現的是爬蟲,實際上微博本身有提供api接口供咱們查詢,咱們只須要找到合適的醫療微博id,並找到該id下評論數較多的微博便可。      在手機或者電腦端,登陸微博,搜索‘醫生’,排在前五的是新浪愛問醫
相關文章
相關標籤/搜索