SEO 詞庫完整指南
2018.11.17數據庫
以前講到了 SEO 頻道,其中極其重要的一步,就是詞庫的創建了。詞庫的整理和收集,一方面能夠根據關鍵詞獲取到精準的、大量的流量,另外一方面也能夠了解用戶的需求,方便第二步的模板設置。scrapy
關鍵步驟
SEO 詞庫通常有如下幾個關鍵步驟:工具
- 抓取
- 擴展
- 過濾
- 補充字段 & 入庫
- 清理 & 優化
第一步 關鍵詞抓取
關鍵詞抓取通常有如下幾個來源:post
- 競爭對手詞庫
- 第三方工具,如 5118
- PPC 或者其餘流量渠道的關鍵詞
抓取的工具也有不少,好比:優化
不過須要注意的是,抓取工具必定要支持往下一層抓取(也叫深度抓取),而不能僅限於源頁面的抓取。搜索引擎
第二步 關鍵詞擴展
抓取一批數據以後不要急着過濾和使用,要先擴展一批。這裏能夠借用搜索引擎的能力和工具進行擴展,有如下幾個方式:spa
- 搜索引擎的搜索框提示詞
- 搜索引擎的相關搜索詞
- PPC 的擴詞工具,如百度推廣助手的關鍵詞工具,Google Keyword Planner Tool.
擴展一大堆關鍵詞以後還有很是重要的一步,就是關鍵詞分析,整理關鍵詞組合。首先,經過分詞和整理,能夠拿到關鍵詞的詞根,以及對應的搜索量。
其次,手工把每一個詞根對應的關鍵詞組合整理出來,並加上搜索量和出現次數最後,就是考慮這些關鍵詞怎麼應用。若是關鍵詞組合的搜索量特別大,並且主題明確且獨特,是建議單獨開設一個頻道,好比 「城市」+ 天氣。而對一些比較零散,無明確規則的關鍵詞,則是須要添加到 SEO 頻道,好比 「杭州八景」。借用一張 GoGo闖 博文中的一張圖:
索引
注:GoGo闖 有一篇講關鍵詞分析的文章,這裏推薦一下《【如何搭建SEO詞庫?】SEO關鍵詞分析》。seo
第三步 關鍵詞過濾
SEO 入庫前還須要進行過濾。如下關鍵詞過濾的具體規則(應該是中文最全的規則了):資源
- 單複數過濾,好比 led light 和 led lights
- 先後順序調整過濾,好比 led light 和 light led
- 空格處理,其中包含首尾空格去除、多個合併爲一個
- 特殊字符處理。除了字母和數字外的其餘符號,都是特殊字符
- 大小寫處理。通常是所有轉換爲小寫
- 年份替換,好比 2016 替換爲 2018
- 去中止詞後去重。必定要注意,先去中止詞以後再去重,好比 「南京天氣」 和 「南京的天氣」,這樣就能夠過濾掉
- 黑名單過濾。這裏能夠過濾掉包含黑名單裏的關鍵詞,而黑名單可人工維護,好比最近的一些敏感詞
- 違禁詞過濾,好比政治類敏感詞、侵權品牌類關鍵詞
- 結果數和相關性檔位過濾。根據搜索結果進行過濾,好比相關性檔位爲 3 的產品少於 20 個,頁面就不會建立(或自動添加 noindex)
- 純數字, 字母過濾。對中文站來說,純字母的關鍵詞比較偏向垃圾詞,對英文站則否則
- 語種過濾。中文站須要排除掉其餘語向的關鍵詞
- 長度過濾。能夠過濾掉過長或太短的關鍵詞
- 單詞數過濾,能夠過濾掉一個單詞,或者超過3個單詞的關鍵詞
注:上述不少規則來自阿里內部的關鍵詞過濾工具中的功能。
第四步 補充字段 & 入庫
入庫時除了關鍵詞之外,還須要補充相關的字段(對應每一個數據庫字段)通常有如下數據:
- 關鍵詞
- 行業分類,好比屬於 3C 行業
- 關鍵詞類型,好比是 price 類
- 添加時間
- 修改時間
- 添加人
- 搜索量
- 百度 / Google 結果數
- 分詞結果,好比 「南京|旅遊|攻略」
第五步 清理 & 優化
- 清理是爲了剔除掉低效的頁面,保證頻道的效率。好比近一年內沒有任何流量的頁面。
- 優化是精細化的運營,好比有一批頁面一直未抓取,則添加一批內鏈促進其抓取;或者排名在第二頁但仍有流量,則須要稍微給一點內鏈幫助其上升到第一頁
其餘高級功能
隨着詞庫規模的擴大,會遇到更多問題。這些都是考慮和解決的。
- 聚類。能夠解決頁面重複的問題,提升頻道效率。
- 分類。能夠根據不一樣的關鍵詞類型,使用不一樣的模板,以更好的知足用戶需求。
- 傾斜。根據搜索量或者轉化率,資源向部分頁面傾斜。
站羣的詞庫
最後多說一點,我也作過站羣的詞庫。在站羣項目中,內容、抓取量、連接資源都是極其有限的。這個時候,詞庫就顯得極其重要。一個好的詞庫,比通常詞庫的效果要好上幾十倍。而好的詞庫,甚至不惜人肉整理。幾萬個關鍵詞人工篩選。
最後
若是對 SEO 詞庫有任何問題,歡迎留言交流!或者但願我分享什麼話題,也能夠留言。