打開控制檯,在頁面查看器裏右鍵點擊須要用到的DOM,Copy -> Copy Selector,此時複製到的就是DOM元素在本頁面最精確的節點路徑
好比我要拿到思否首頁的logo的節點路徑body > div.global-nav.sf-header.sf-header--index > nav > div.row.hidden-xs.hidden-sm > div.col-sm-8.col-md-9.col-lg-9 > div.sf-header__logo > h1 > a
dom
puppeteer爬蟲是去拿的頁面的dom,{waitUntil: 'domcontentloaded'},加上這句話表示等待頁面DOM加載完成後纔有返回值,這樣避免了頁面DOM沒加載完就去爬數據而致使的錯誤
await page.goto(url, {waitUntil: 'domcontentloaded'});url