上一篇講到爬蟲,爬取頁面裏的文字內容是最基礎的,除此以外我還想要整個網頁的截圖怎麼辦呢。Page2Images就能夠上場啦。在Leanstack上,這類服務被稱爲Screenshot as a Service(又一個SaaS...)。這麼看來Service as a Service不遠了啊(是說就是consultant麼,那有沒有consultant的consultant service呢)。javascript
做爲一個膚淺的服務,最重要的就是...臉。相比它的同行URL2PNG,Page2Images的小章魚和Github有一拼,因此,好了就它了。忽然想到,要是有個服務讓我一輸入名字就顯示出Ta的臉,該是有多...膚淺。因而我搜了下「馮小平」,找到了第一張單臉照。前端
好,等我出名之後再找這種服務...java
從名字Page2Images能夠看出,他們的數據庫試圖設計成一對多的關係。由於,「男人不止一面」。一個頁面也能夠有不少Screenshot,尤爲是在這個Responsive肆虐的世界。好,你想到了Phone,Pad,Desktop不一樣尺寸是否是?嗯,直接來看最簡單的使用方法:在你的頁面插入一個標籤,裏面顯示某個網頁的某個尺寸的截圖。章魚給了個簡單易用的工具來幫助你生成想要尺寸的截圖。出來的HTML差很少長這樣。數據庫
<img id=」p2i_demo」 src=」http://api.page2images.com/directlink?p2i_url=http://apple.com&p2i_device=4&p2i_screen=768×1024&p2i_key=b00cc2e6ac5e8f**″ />
好了我知道你想說:我這裏現實的沒有框啊!嗯,本身找參數去。api
好了我知道你又想說什麼,爲啥目標URL不encode啊!呃,其實吧,不encode又怎麼着...嗯,除非你蛋疼的爬到一個URLapp
http://service.exmail.qq.com/cgi-bin/help?u=0&p2i_device=6&id=28
懂了嗎?沒懂去鍛鍊鍛鍊。工具
這類服務爲了收錢,必定得把收費的部分作到比較嚴謹。因此Page2Images裏把API key分紅兩類,Direct Link和Rest API。前者用於在前端頁面使用,好比img,javascript,後者用於服務端調用。因此前者除了要驗證Token之外,還要被綁定在某個Domain或上,然後者只要帶着對的Token就能訪問。(因此若是有一個建站工具裏,a.xxx.com是一個站,若是建立Direct Link Key的時候沒有注意,Domain寫了*.xxx.com,則b.xxx.com也能用前者的Token了)。url
URL2PNG不提供免費帳戶,但Page2Images提供,爲毛呢?Price Table裏有一個很重要的參數:Hits(Cached),而後天天Unique URLs是100個。懂了吧,最大負擔就是每一個帳號天天100個請求了。spa
最後感慨一下,人家作這麼個都能收費。哎...設計