10/27python學習

第13、14章沒學 1、屏幕抓取是通過程序下載網頁並從中提取信息的過程。從概念上講,這項技術需要下載數據並對其進行分析。例如,可使用urllib來獲取網頁的HTML代碼,再使用正則表達式或其他技術從中提取信息 2、Tidy是用於對格式不正確且不嚴謹的HTML進行修復的工具。 有多個用於python的Tidy庫包裝器,可從Tidy網站(http://html-tidy.org)獲取可執行的二進制版本
相關文章
相關標籤/搜索