數據採集流程--採集阿里巴巴商品信息--使用甩手工具箱進行採集

 說明:這次採集是採用軟件進行,須要付費(此處費用以下圖)mysql

第一步:註冊登錄甩手網sql

http://www.shuaishou.com/products/ToolBox/數據庫

帳號:*********工具

密碼:********優化

第二步:下載甩手軟件spa

第三步:安裝甩手工具箱軟件,點擊最右測「使用」3d

點擊當即訂購htm

去支付blog

第四步:登錄阿里巴巴(1688)平臺,查找產品列表頁圖片

http://page.1688.com/

https://s.1688.com/selloffer/offer_search.htm#beginPage=1&offset=0

beginPage爲頁碼

 

第五步:複製上述地址到甩手軟件抓取網址欄,點擊抓取整頁商品(此處爲第1頁)

點擊下一步:

下載完成後出現下圖界面:

點擊下一步:

選中導出淘寶助理數據包,點擊下一步:

注:此處轉換後類目名稱可能不成功,能夠手動點擊選擇相應類目再繼續下一步

全選,點擊屬性預轉換

點擊下一步:

 

全選點擊下一步:

點擊導出:

點擊打開文件夾:

點擊打開淘寶助理5201709031943.csv文件,查看轉換效果

刪除第一行,並將csv文件另存爲xls文件

安裝mysql數據庫客戶端navicat客戶端

右擊彈出導入對話框

點擊下一步:

點擊下一步:

點擊下一步,導入成功

點擊下一步:

此處能夠給這個表加一個主鍵,另外能夠將該表修改合適的字段的類型和長度,因爲此表比較長,能夠考慮優化進行分表存儲(此處因爲時間關係沒有作分表+加主鍵+修改字段類型和長度的操做)。

 

點擊下一步:

點擊下一步後點擊開始

說明:此處沒有采集徹底,只採集了第1頁的商品信息,其餘頁數據採集同理

      此軟件也將商品圖片採集下來了

相關文章
相關標籤/搜索