Python爬蟲實戰之xpath爬取貓眼電影排名

時間 2020-08-12

原文原文鏈接

基本原理： requests模塊獲取每一頁的html文件，須要注意的是貓眼電影加了反爬蟲，因此須要加上User-Agent 經過xpath提取字段信息，爲了整潔，經過切片和替換，去掉了一些字段信息經過csv模塊，將數據寫入csv 代碼以下： #!/usr/bin/env python # -*- coding:utf-8 -*- # @Time : 2020/06/02 22:36:03 # @

>>阅读原文<<