[爬蟲系列(一)]爬取豆瓣電影排行前250

時間 2019-12-07

原文原文鏈接

這是個小爬蟲,基於python2.7.主要用到了BeautifulSoup庫和urllib2的urlopen,爬取豆瓣電影排行前250,並保存在文件中. 主要分爲三個步驟: * 分析url * 分析網站數據 * 爬取數據python 一.分析url 豆瓣電影排行榜250的url很好分析: 格式都是這樣子的:git http://movie.douban.com/top250?start=(page