文/玄魂php
谷歌網頁搜索技術,大部分在百度等搜索引擎中也適用。一樣,這些搜索技術是來源於傳統數據庫檢索技術,於是,對這部分的學習,能爲後續章節的數據庫檢索奠基基礎,並能得到直觀的認識。本部分結合應用實例的講解也能讓咱們加深信息檢索對解決實際問題、提升搜索效率的認知。node
同許多搜索引擎同樣,當直接在搜索框中輸入搜索詞時,谷歌默認進行模糊搜索,並能對長短語或語句進行自動拆分紅小的詞進行搜索。linux
示例:web
給關鍵詞加上半角引號實現精確搜索,不進行分詞。sql
示例:"kali linux web滲透測試"shell
谷歌的通配符是星號「*」,必須在精確搜索符雙引號內部使用。用通配符代替關鍵詞或短語中沒法肯定的字詞。數據庫
示例:"kali * web滲透測試"apache
與通配符星號「*」不同的是,點號「.」匹配的是字符,不是字、短語等內容。保留的字符有[、(、-等。緩存
示例:app
布爾邏輯是許多檢索系統的基本檢索技術,在搜索引擎中也同樣適用,在谷歌網頁搜索中須要注意的是:谷歌和許多搜索引擎同樣,多個詞間的邏輯關係默認的是邏輯與(空格)。當用邏輯算符的時候,詞與邏輯算符之間用須要空格分隔,包括後面講的各類語法,均要有空格。邏輯非是特例,即減號必須與對應的詞連在一塊兒。對於複雜的邏輯關係,可用括號分組。
示例:滲透測試玄魂的博客
示例:滲透測試 AND 玄魂的博客
示例:"玄魂的博客" (kali | node)
上圖顯示的結果爲搜索結果中必須包含「玄魂的博客」同時包含「kali」或者「node」的網頁。
示例:"玄魂的博客" -kali
上圖中顯示結果爲包含「玄魂的博客」同時不包含「kali」的網頁內容。
加號「+」用於強制搜索,即必須包含加號後的內容。通常與精確搜索符一塊兒應用。
示例:"玄魂的博客" +"愚蠢的人類"
用兩個點號「..」表示一個數字範圍。通常應用於日期、貨幣、尺寸、重量、高度等範圍的搜索。用做範圍時最好給必定的含義。
示例:kali linux 2010年..2014年
邏輯組配時分組,避免邏輯混亂。括號「()」是分組符號。
示例:見上文 1.5節。
一般標題是內容的高度歸納,在標題中搜索的結果準確率會更高。谷歌搜索中限定搜索網頁或文檔標題的語法是:intitle或allintitle。allintitle是intitle的變體,至關於在各個搜索詞前加上intitle。兩者差異不明顯,咱們通常直接用intitle。
示例:intitle:"WSO 2.4" [ Sec. Info ], [ Files ], [ Console ], [ Sql ], [ Php ], [ Safe mode ], [ String tools ], [ Bruteforce ], [ Network ], [ Self remove ]
上圖 爲使用intitle屬性查找網站上被黑客上傳的WSO後門網頁。打開個別網頁能夠發現webshell。
僅僅在網頁或文檔的正文部分搜索。谷歌搜索中限定搜索網頁或文檔正文的語法是:intext或allintext。
示例:intitle:"index" intext:"Login to the Administrative Interface"
此示例結合intitle和intext尋找Web2Py的管理後臺。
打開一個連接。
谷歌搜索中限定搜索網址的語法是:inurl。是In-係指令中最強大的一個,換句話說,這個高級指令可以直接從網站的URL入手挖掘信息,只要略微瞭解普通網站的URL格式,就能夠極具針對性地找到你所須要的資源--甚至隱藏內容。網站構建者一般將某一類信息集中在一個網站的目錄中,因此搜索URL中的詞自己就是對某一方面內容的一個限定。若是在加上必定的詞進行組配,搜索結果將更貼近需求。
示例:inurl:phpmyadmin/index.php & (intext:username & password & "Welcome to")
該示例經過url中的特徵路徑和頁面的中的特殊文本,尋找安裝有phpmyadmin的站點的對應管理入口。
打開其中的一個連接,以下:
在作網站中有時候用錨點來連接一個頁面中的其它部份內容,這樣方便瀏覽和定位。也就是說錨點連接的內容一般是網頁內容中重要的章節或內容的開始部分,於是對它們的搜索也更能反映網頁的主題內容,提升搜索結果的準確度。對於熟悉網頁製做的人來講,能夠從網頁源代碼中查看有錨點的HTML代碼
谷歌網頁搜索在錨鏈連接中語法是:inanchor或allinanchor。搜索範圍限制在頁面的連接錨點描述文本進行搜索。
示例:inanchor:修改密碼
谷歌網頁搜索不只僅能搜索網頁,還能搜索各類文檔,經過文檔類型限定只對文檔進行搜索,從而不顯示頁面的內容。語法是:filetype。這個語法很是有用,咱們在網上經常要找一些範文或參考資料的時候經常使用這個語法。filetype是根據文件後綴搜索特定文件類型,好比支持的文檔有:pdf、ppt、doc、xls等;網頁文件:htm、asp、php等。
示例:filetype:sql site:com and "insert into" admin "2014"
本示例經過filetype 查找sql文件,而且但願獲得的結果爲插入admin用戶的腳本。搜索結果以下:
打開其中的一個連接,咱們能夠看到sql的內容。
用cache語法的通常狀況是:當一個連接沒法訪問時(或信息被屏蔽時);當信息已經被修改,想看之前的信息時。
示例:cache:www.xuanhun521.com
related語法對於發現某一類信息很是有用,好比當你用related搜索一個圖書館網址的時候會出來大量圖書館的網站,如【related:lib.nit.net.cn】;當搜索某期刊網址的時候,能搜索出大量給學科領域的相關期刊,如【related:www.lis.ac.cn】。
示例:related:www.kali.org
搜索全部連接到某個特定URL上的頁面.
例如,想搜索全部連接www.xuanhun521.com的頁面,但要排除本站網頁。
示例:link:www.xuanhun521.com -site:www.xuanhun521.com
搜索範圍限制在某網站或頂級域名中。
示例:site:www.xuanhun521.com
第一個示例,咱們經過下面的查詢語句,查找能夠未經受權就能夠訪問的phpMyAdmin的後臺頁面。
尋找一個頁面,點開看看:
第二個示例,咱們搜索可能存在openssl心臟出血漏洞的站點。
這個搜索可謂一舉多得,由於apache暴露ssl版本的頁面通常是可枚舉的目錄頁面,在這樣的頁面中咱們能夠探究網站的組織目錄。
原文連接:http://www.xuanhun521.com/Blog/2014/8/13/google-hack-%E4%B9%8B-%E6%9F%A5%E8%AF%A2%E8%AF%AD%E6%B3%95
ps:對此文章感興趣的讀者,能夠加qq羣:Hacking:303242737;Hacking-2羣:147098303;Hacking-3羣:31371755;hacking-4羣:201891680;Hacking-5羣:316885176