有一個功能是,天天打開一個網址,裏面會有一段數據,數據裏有url,這個url是天天會變的,取出這個url而後在新窗口裏打開,下載--解壓--再調用html
個人工做是把這些操做自動化了python
先是獲取頁面數據--取出我要的地址 結構是csv{json
url:http~~~~~~ }網站
嚴格來講這個實際上是一個網站,可是能夠把他當作是一個接口請求,而後獲取到json裏的key,先記下吧,這是我今天的進度ui
由於上午我走了不少彎路,百度搜索python怎麼獲取頁面指定元素,而後出來一堆urlib,和BeautifulSoup實現的方法,而後爲了安裝這兩個插件,掉坑裏兩小時,使用pip更新的時候提示ssl failed,而後用命令更新pip版本,仍然提示ssl的問題;在網上查了使用pip --trsted-host pypi.python3.org install --upgrade pip命令,提示 Could not find a version that satisfies the requirement pip (from versions: )。反正弄來弄去,最後的終於辦法是去https://pypi.org/project/pip/#files 官網下載安裝文件保存在本地,而後使用pip install --upgrade pip 才更新成功;pip更新成功後再安裝其它軟件就沒再提示ssl驗證的問題了url
而後還有一個問題 Missing parentheses in call to 'print' 的錯誤處理.net
SyntaxError: Missing parentheses in call to 'print'插件
緣由:Mac安裝倆個python版本,2和3,python2系列能夠支持 print 「xxxx」 ,python系列須要使用print("xxx")htm
感謝博主分享 https://blog.csdn.net/dracotianlong/article/details/48607593/blog
————————————————————————————————————————————
補充了後面的部分,解壓文件.gz格式