攻防世界 web robots

robots 題目 場景 Robots協議 robots.txt是搜索引擎中訪問網站的時候要查看的第一個文件。robots.txt文件告訴網絡爬蟲在服務器上什麼文件是可以被查看的。 當一個網絡爬蟲訪問一個站點時,它會首先檢查該站點根目錄下是否存在robots.txt,如果存在,搜索機器人就會按照該文件中的內容來確定訪問的範圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網站上所有沒有被口令保護的頁面
相關文章
相關標籤/搜索