python實例:自動爬取豆瓣讀書短評,分析短評內容

思路:html 一、打開書本「更多」短評,複製連接python 二、腳本分析連接,經過獲取短評數,計算出頁碼數app 三、經過頁碼數,循環爬取當頁短評函數 四、短評寫入到txt文本post 五、讀取txt文本,處理文本,輸出出現頻率最高的詞組(前X)----經過分析獲得其餘結果可自由發散url 用到的庫:spa lxml 、re、jieba、time 整個腳本以下code # -*-coding:
相關文章
相關標籤/搜索