關於攜程酒店的爬蟲,網上有不少,我仔細看了下,大概的分紅了兩派:selenuim與python執行JS,夾生飯大佬在知乎的專欄中也講述的很清楚了,我不想再復刻他的文章了,並且我在github中也找到了開源項目針對攜程酒店的,連接點擊這裏,我在復現夾生飯大佬代碼的過程當中始終有一段代碼沒找到python
callback = """ var callback = function() { for (var t = ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z"], o = "CAS", n = 0; n < 15; n++) { var i = Math.ceil(51 * Math.random()); o += t[i] } return o }; """
在網上別人展現出來的代碼中也沒有取講解這個函數是在那找到的。不過就像夾生飯大佬說的同樣,獲取到數據纔是關鍵!git
點評一下復現的過程,處理JS真的是一個須要經驗的活,還不懂這一塊,就須要花時間去補。之後會更多的爬相似的網站,本身也但願出相似的教程!github