刷百度相關參數詳解

時間 2019-11-07

標籤百度相關參數詳解简体版

原文原文鏈接

因不少人須要百度相關搜索，不少人用這個技術賣錢，本身本着技術的愛好，把這個分享給你們！刷相關搜索的實現方法：第一：好比圓柱模板，咱們能夠先搜索圓柱模板廠家，而後接着再去搜索圓柱模板價格，那麼天天以幾倍的方式增長，當達到必定搜索量的時候，那麼圓柱模板的相關詞搜索就會出現圓柱模板價格了。打開百度首頁//www.baidu.com/輸入圓柱模板出來的地址爲： html

[Asm] 純文本查看複製代碼

1	`https://www.baidu.com/s` `?` `ie=UTF-8&wd=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

這串代碼中：算法

[Asm] 純文本查看複製代碼

1	`E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

是表明圓柱模板的代碼再出來的頁面中輸入你要的品牌，好比鵬程圓柱模板，輸入完畢後，點百度一下。數組

[Asm] 純文本查看複製代碼

1	`https://www.baidu.com/s` `?` `bs=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&f=8&rsv_bp=1&wd=%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&inputT=54390[/font][/color]`

這串代碼中：
cookie

[Asm] 純文本查看複製代碼

1	`%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF`

是不變的，表明：圓柱模板關鍵詞 f=8這個數值是會變更的。範圍爲： 0-9.數值越高，表明着這個相關搜索的詞越容易作上去。 app

[Asm] 純文本查看複製代碼

1	`%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%`

表明的是：鵬程圓柱模板這個相關詞的代碼搜索引擎

[Asm] 純文本查看複製代碼

1	`inputT=54390`

表明這個是表明搜索結果出來的運算時間

  相關搜索算法實現原理：用戶後繼詞原理：
把用戶在5分鐘以內在搜索引擎中搜索詞定義爲一次搜索行爲，那麼就造成了搜索日誌，搜索日誌以下：
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
接着按用戶進行分類，時間間隔5分鐘進行數據清理，[x1,x2.....]一個數組表示一次搜索行爲，每一個數組的第一位就是當次搜索行爲的第一個搜索詞。
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
對於單個用戶來講搜索後繼詞的肯定性是不夠的，好比搜索科比，可是一看到旁邊有人我就馬上改變搜索培訓，那麼這兩個詞是沒有相關性質的。那麼就加入統計規則去掉一些雜質，好比某個詞B只有出如今5個用戶的相同的搜索詞A的後繼詞中才算一個A的後繼詞，還有其餘的一些規則，這麼下來，日誌就變成了。
key：A succeed：A1,A2,A3.....
  用戶協同過濾原理：
key：A succeed：A1,A2,A3.....    用戶協同過濾原理：從搜索詞算法實現：若是一個關鍵詞搜索詞結果，跟另一個，甚至幾個關鍵詞搜索出來的結果不少交集，那麼這些關鍵詞極可能也是語義相關的詞。從搜索日誌來看例子： key:搜索詞 time:搜索時間 cookie:用戶cookieid result:a,b,c,d,e(前5個搜索結果)此次，咱們只用key和result兩項，稍微處理下來之後就變成了
key:搜索詞A result:a,b,c,d,e(前5個搜索結果)
key:搜索詞B result:a,f,c,g,m(前5個搜索結果)
若是咱們把每一行數據的result想象成一篇文檔，result裏面的每一個結果集想象成一個詞語，那麼這其實就是求兩個文檔之間的類似性了，從頭至尾過一遍就能夠找到每一行數據和它最類似的數據了，而每一行能夠用當行的搜索詞表示，這麼一算下來數據就變成這樣子了，後面的括號裏面是兩個詞的類似度key：搜索詞Asucceed：搜索詞B(0.8)搜索詞C(0.6).....
key：搜索詞Bsucceed：搜索詞A(0.8)搜索詞E(0.7).....
有了上面這個數據，拍一個閾值(好比0.7)卡一下，就獲得最後的相關搜索的結果了。
這個計算類似性的方法的計算量比較大，並且閾值沒有卡好的話容易出現不相關的結果，在實際工程應用中使用得很少，下面這個方法使用得更多點，至關於這個的增強版。
從用戶搜索結果集考慮
若是某個搜索結果(好比一個網頁或者一個商品)出如今了不一樣的搜索詞的結果集中，那麼這些個搜索詞極可能是相關的，若是這個搜索結果在不一樣的搜索詞下都被點擊了，那麼這些個詞的相關性就更高了。
點擊的加成是很強大的，並且在數據量巨大的狀況下，咱們能夠只考慮點擊的狀況，仍是拉出搜索日誌，不過此次是搜索點擊日誌了，拉出來處理一下就變成下面這個樣子，每行就是某個搜索詞下點擊的商品key：搜索詞Aclick:結果A結果B結果C
這個樣子和上面第二種方法最後出來的樣子基本同樣，不過此次是點擊數據，相關性可比直接的搜索結果要好不少了，由於搜索結果取決於你的搜索算法，而這種點擊數據是來自用戶的，人的可靠性可高了很多，因此說這個是上一個的增強版。
咱們能夠按照上一個的方法按文本類似性的方法進行處理，可是計算量也比較大，若是再仔細看看這個數據的樣子，若是咱們把相關搜索系統想象成豆瓣，搜索詞當作豆瓣的用戶，搜索結果集當作是豆瓣的電影，那麼相關搜索就變成了一個豆瓣的猜你感興趣的人，也變成了一個協同過濾的推薦系統了(協同過濾算法能夠參考文章最後的連接)，上一節的協同過濾算法的數據是詞和後繼詞，這裏是詞和點擊結果，雖然數據集不一樣，可是能夠用同樣的算法，因此，搜索和推薦技術實際上是密不可分的，既然這樣，徹底能夠用協同過濾算法進行推薦了。
協同過濾的算法，簡單版本總體不會超過200行，很容易實現的。
經過這樣的方式，容易推出意思相近的詞，一樣也容易推出看似徹底不相關但仔細想一想仍是靠譜的詞，就像下面這樣，他們雖然不見得近義詞，可是極可能會點擊到同一個結果上。spa

轉載自：日誌

https://www.52pojie.cn/thread-1038009-1-1.html?from=timeline&isappinstalled=0code

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。