據外媒上週報道,谷歌已於近日在一次更新中將名爲「BERT(Bidirectional Encoder Representations from Transformers)」的機器學習算法加入到了搜索引擎中,以便更好地理解用戶在搜索欄中輸入的關鍵詞或問題,更準確地分析每一句話中不一樣關鍵詞之間的關係,提高搜索體驗。算法
BERT 其實是來自谷歌的基於機器學習的天然語言處理開源框架,谷歌但願經過 BERT 來實現對同一個查詢請求中打亂順序的關鍵詞之間關係的判別,以改變過去只能按照關鍵詞輸入順序來判斷搜索意圖的情況。框架
隨着 BERT 的引入,各網站的天然排名以及谷歌精選摘要的顯示結果也會發生改變。其中,電商網站極可能將所以受益最大,它們能夠藉助具備高購買導向性的外部連接,帶來更多的天然搜索流量。機器學習
此外,BERT 還增強了對句子中介詞的理解能力,這是由於一句話中有無介詞或介詞用法的不一樣均可能會徹底改變句子想表達的意思。學習
據瞭解,在此次搜索引擎的更新中,谷歌並未用 BERT 將 RankBrain 替換掉,而是將這二者同時啓用以提供更爲準確的搜索結果。RankBrain 是谷歌於 2015 年推出的機器學習系統,可自主學習、理解用戶輸入的新關鍵詞,爲用戶在搜索時提供更多相關聯的結果。網站
據外媒報道,谷歌將 11038 本未經標註的書籍以及來自維基百科內容的 25 億文字,用於爲 BERT 訓練模型。谷歌還隨機去掉了文本里原有的一些單詞,讓 BERT 本身判斷缺乏的單詞是什麼。搜索引擎
BERT 經過學習這些文本,就能夠逐漸掌握語句與關鍵詞之間的規律,理解不一樣關鍵詞之間的關係,甚至能分析出這些關鍵詞背後相關實體之間的聯繫。spa
據谷歌介紹,BERT 已經於上個月底完成了在美國的部署,將來還將應用到更多不一樣語言的版本上。目前大概會有 10% 從美國地區發起的英文天然搜索會被 BERT 干預,而剩餘的 90% 搜索流量以及與新聞、圖片、支付相關的搜索,還有其餘國家及地區的搜索均不會受此影響。code
谷歌但願藉助 BERT,在進行好比長尾的、與電商相關的那些更爲複雜的查詢時,其天然搜索及精選摘要的顯示結果能有更出色的表現。orm