刷百度相關參數詳解

  因不少人須要百度相關搜索,不少人用這個技術賣錢,本身本着技術的愛好,把這個分享給你們!    刷相關搜索的實現方法:第一:好比圓柱模板,咱們能夠先搜索圓柱模板廠家,而後接着再去搜索圓柱模板價格,那麼天天以幾倍的方式增長,當達到必定搜索量的時候,那麼圓柱模板的相關詞搜索就會出現圓柱模板價格了。  打開百度首頁//www.baidu.com/輸入圓柱模板出來的地址爲:   html

[Asm]  純文本查看 複製代碼
?
1
https://www.baidu.com/s ? ie=UTF-8&wd=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF

   這串代碼中:   算法

[Asm]  純文本查看 複製代碼
?
1
E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF

是表明圓柱模板的代碼   再出來的頁面中輸入你要的品牌,好比鵬程圓柱模板,輸入完畢後,點百度一下。     數組

[Asm]  純文本查看 複製代碼
?
1
https://www.baidu.com/s ? bs=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&f=8&rsv_bp=1&wd=%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&inputT=54390[/font][/color]


   這串代碼中:
   
cookie

[Asm]  純文本查看 複製代碼
?
1
%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF


    是不變的,表明:圓柱模板  關鍵詞   f=8這個數值是會變更的。範圍爲:  0-9.數值越高,表明着這個相關搜索的詞越容易作上去。   
app

[Asm]  純文本查看 複製代碼
?
1
%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%

   表明的是:鵬程圓柱模板 這個相關詞的代碼   搜索引擎

[Asm]  純文本查看 複製代碼
?
1
inputT=54390

    表明這個是表明搜索結果出來的運算時間   

  相關搜索算法實現原理:用戶後繼詞原理:
把用戶在5分鐘以內在搜索引擎中搜索詞定義爲一次搜索行爲,那麼就造成了搜索日誌,搜索日誌以下:
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
接着按用戶進行分類,時間間隔5分鐘進行數據清理,[x1,x2.....]一個數組表示一次搜索行爲,每一個數組的第一位就是當次搜索行爲的第一個搜索詞。
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
對於單個用戶來講搜索後繼詞的肯定性是不夠的,好比搜索科比,可是一看到旁邊有人我就馬上改變搜索培訓,那麼這兩個詞是沒有相關性質的。那麼就加入統計規則去掉一些雜質,好比某個詞B只有出如今5個用戶的相同的搜索詞A的後繼詞中才算一個A的後繼詞,還有其餘的一些規則,這麼下來,日誌就變成了。
   key:A succeed:A1,A2,A3.....
  用戶協同過濾原理:
   key:A succeed:A1,A2,A3.....     用戶協同過濾原理:    從搜索詞算法實現:    若是一個關鍵詞搜索詞結果,跟另一個,甚至幾個關鍵詞搜索出來的結果不少交集,那麼這些關鍵詞極可能也是語義相關的詞。   從搜索日誌來看例子:   key:搜索詞 time:搜索時間 cookie:用戶cookieid result:a,b,c,d,e(前5個搜索結果)此次,咱們只用key和result兩項,稍微處理下來之後就變成了
key:搜索詞A result:a,b,c,d,e(前5個搜索結果)
key:搜索詞B result:a,f,c,g,m(前5個搜索結果)
若是咱們把每一行數據的result想象成一篇文檔,result裏面的每一個結果集想象成一個詞語,那麼這其實就是求兩個文檔之間的類似性了,從頭至尾過一遍就能夠找到每一行數據和它最類似的數據了,而每一行能夠用當行的搜索詞表示,這麼一算下來數據就變成這樣子了,後面的括號裏面是兩個詞的類似度key:搜索詞Asucceed:搜索詞B(0.8)搜索詞C(0.6).....
key:搜索詞Bsucceed:搜索詞A(0.8)搜索詞E(0.7).....
有了上面這個數據,拍一個閾值(好比0.7)卡一下,就獲得最後的相關搜索的結果了。
這個計算類似性的方法的計算量比較大,並且閾值沒有卡好的話容易出現不相關的結果,在實際工程應用中使用得很少,下面這個方法使用得更多點,至關於這個的增強版。
從用戶搜索結果集考慮
若是某個搜索結果(好比一個網頁或者一個商品)出如今了不一樣的搜索詞的結果集中,那麼這些個搜索詞極可能是相關的,若是這個搜索結果在不一樣的搜索詞下都被點擊了,那麼這些個詞的相關性就更高了。
   點擊的加成是很強大的,並且在數據量巨大的狀況下,咱們能夠只考慮點擊的狀況,仍是拉出搜索日誌,不過此次是搜索點擊日誌了,拉出來處理一下就變成下面這個樣子,每行就是某個搜索詞下點擊的商品key:搜索詞Aclick:結果A結果B結果C
這個樣子和上面第二種方法最後出來的樣子基本同樣,不過此次是點擊數據,相關性可比直接的搜索結果要好不少了,由於搜索結果取決於你的搜索算法,而這種點擊數據是來自用戶的,人的可靠性可高了很多,因此說這個是上一個的增強版。
   咱們能夠按照上一個的方法按文本類似性的方法進行處理,可是計算量也比較大,若是再仔細看看這個數據的樣子,若是咱們把相關搜索系統想象成豆瓣,搜索詞當作豆瓣的用戶,搜索結果集當作是豆瓣的電影,那麼相關搜索就變成了一個豆瓣的猜你感興趣的人,也變成了一個協同過濾的推薦系統了(協同過濾算法能夠參考文章最後的連接),上一節的協同過濾算法的數據是詞和後繼詞,這裏是詞和點擊結果,雖然數據集不一樣,可是能夠用同樣的算法,因此,搜索和推薦技術實際上是密不可分的,既然這樣,徹底能夠用協同過濾算法進行推薦了。
   協同過濾的算法,簡單版本總體不會超過200行,很容易實現的。
    經過這樣的方式,容易推出意思相近的詞,一樣也容易推出看似徹底不相關但仔細想一想仍是靠譜的詞,就像下面這樣,他們雖然不見得近義詞,可是極可能會點擊到同一個結果上。
spa

轉載自:日誌

https://www.52pojie.cn/thread-1038009-1-1.html?from=timeline&isappinstalled=0code

相關文章
相關標籤/搜索