身處疫情中心,在家無聊寫了個小程序,天天自動抓取武漢衛健委公佈的武漢地區的最新具體數據。html
獲取網站上的公佈的數據後,自動轉發到個人郵箱。git
requests_html
庫,進行網站爬蟲抓取疫情數據的邏輯plt
展示每日變化結果
session對象的屬性links
和 absolute_links
返回的是集合set,即便轉成list也是無序的github
所以從html源文件中讀取到第 k 條新聞title與links[k]並不一一對應web
解決方法:正則表達式
騰訊雲服務器上沒法運行以上代碼,報錯信息:ImportError: cannot import name ‘Coroutine’小程序
具體在 from typing import Coroutine 緣由不明api
解決方法:服務器
郵件列表
session
具體代碼見個人github項目優化
(完)