如今在百度上面搜索一個關鍵詞,最前面的幾個搜索結果都是廣告,好比你搜索一個Python,前面幾個都是百度競價的Python培訓機構。ide
既然是淨化,廣告什麼的固然要統統剔除啦。。。網站
Python版本:3.5.43d
相關模塊:code
requests模塊、bs4模塊、win_unicode_console模塊、PyQt5模塊以及一些Python自帶的模塊。cdn
環境搭建視頻
安裝Python並添加到環境變量,pip安裝須要的相關模塊便可。blog
利用Python處理百度搜索關鍵字後返回的頁面,提取其中的有效信息。教程
(1)直接運行ip
功能:unicode
在cmd窗口運行BaiduSearch_Spider.py文件後,根據提示輸入相關信息後將獲得的有效信息保存到results.txt文件中。
若需其餘功能請自行修改源代碼。
運行示例以下圖所示:
結果:
(2)做爲模塊導入
使用示例以下圖所示:
運行以及結果圖:
返回的數據格式爲:
簡單實例:
功能:
(1)在cmd窗口中運行並展現得到的有效信息;
(2)根據有效信息選擇想要了解的連接後將該連接網站在PyQt製做的簡易Demo中顯示。
結果圖:
細心的小夥伴可能會發現:
這裏不支持播放這種視頻,由於我沒配置,官網有配置教程,全英文實在懶得看,若是須要深刻了解的小夥伴能夠本身去看一下文檔。