最近在負責一個SEO的項目,一路上遇到不少坑,捅了很多簍子,能夠說算是SEO的特性相關,所以想寫一篇博客當總結,主要圍繞2部分去展開:css
1)什麼是SEO
2)SEO的特性,或者說須要注意的點
複製代碼
那seo究竟是什麼?去度娘找了下資料,解釋如何:
SEO(Search Engine Optimization):搜索引擎優化;
html
那是幹嗎的?
是一種方式:利用搜索引擎的規則提升網站在有關搜索引擎內的天然排名
前端
目的是什麼?
爲網站提供生態式的自我營銷解決方案,讓其在行業內佔據領先地位,得到品牌收益
jquery
簡單理解,就是在瞭解搜索引擎排序原理的基礎上,對網站進行站內和站外優化,從而提高網站關鍵詞排名機率,獲取流量;
ajax
這樣須要說明,seo不只僅是排名,它是五個要素的集合,即搜索需求覆蓋,收錄,排序,展示以及數據分析。數據庫
通常高質量的站點,都會有如下特徵:瀏覽器
1:站內關鍵詞佈局合理。有系統化的細分行業關鍵詞庫,可知足不一樣用戶的關鍵詞差別化搜索需求。
2:網站具有良好的收錄比。大量有效的收錄下降了無效頁面的佔比。
3:或品牌詞,或長尾關鍵詞,或次要關鍵詞在搜索引擎中的位置合理。尤爲是長尾關鍵詞的流量佔比更大。
4:網站佈局合理,界面美觀,視覺觀感強,相應的互動功能齊備,能知足大多數細分用戶的搜索需求,能留住點擊進來的新用戶,並轉化爲老用戶。
5:網站打開速度穩定且快速,有良好的用戶體驗。
6:對於使用不一樣設備瀏覽網站的用戶,針對性的對網站進行適配等設置,保障用戶可方便,正常瀏覽。
7:網站外鏈呈天然增加態勢。
8:網站內容受衆大,內容質量度高。
9:具有良好的歷史數據積累,在搜索引擎中有較大的品牌影響力。
10:用戶有較好的訪問深度,跳出率低,停留時間長。
複製代碼
什麼是404頁面
緩存
404頁面是客戶端在瀏覽網頁時,服務器沒法正常提供信息,或是服務器沒法迴應,且不知道緣由所返回的頁面。
404錯誤信息一般是在目標頁面被更改或移除,或客戶端輸入頁面地址錯誤後顯示的頁面。
複製代碼
404頁面有什麼用?安全
1.避免出現死鏈
網站設置404頁面後,若是網站出現死連接,搜索引擎蜘蛛爬行這類網址獲得「404」狀態迴應時,即知道該URL已經失效,
便再也不索引該網頁,並向數據中心反饋將該URL表示的網頁從索引數據庫中刪除;
2.提高用戶體驗
404頁面一般爲用戶訪問了網站上不存在或已刪除的頁面,服務器返回404錯誤頁面,告訴瀏覽者其所請求的頁面不存在
或連接錯誤,同時引導用戶使用網站其餘頁面而不是關閉窗口離開,提升用戶體驗;
3.避免被懲罰
有些網站因爲應用了一些錯誤的服務器配置,致使返回的是200狀態碼或是302狀態碼,雖然這些狀態碼對訪問網站的用戶
沒有影響,可是卻會誤導搜索引擎,使搜索引擎認爲該頁面是有效頁面,從而抓取下來。若是404頁面過多,就形成了大量
的重複頁面,頗有可能被搜索引擎認爲是做弊而遭到懲罰;
複製代碼
從seo的角度來看404錯誤頁面服務器
搜索引擎經過HTTP狀態碼來識別網頁的狀態。當搜索引擎得到了一個錯誤連接時,網站應該返回404狀態碼,告訴搜索
引擎放棄對該連接的索引。而若是返回200或302狀態碼,搜索引擎就會爲該連接創建索引,這致使大量不一樣的連接指向
了相同的網頁內容。結果是,搜索引擎對該網站的信任度大幅下降。因此不少網站存在這個問題:404頁
返回的是200或302狀態碼而不是404狀態碼;
複製代碼
什麼是百度權重
它是站長工具等第三方平臺以當前網站關鍵詞排名狀況所帶來的預估流量爲標準,對網站劃分等級,共10個級別,
如權重1,權重9等。須要注意的是,百度權重以關鍵詞排名所帶來的預估流量對網站進行評級。
而谷歌pr,搜狗sr是以網站的綜合質量爲基礎進行評級。
複製代碼
影響百度權重的因素有哪些 影響百度權重的因素有多個維度,這些維度相似於相乘結果而不是相加結果。
1:網站外鏈的相關性,數量,普遍度,曝光度,質量。
2:網站內鏈的相關性,扁平化,淺層次化。
3:文章內容的質量度。
4:域名年齡。
5:網站歷史數據的積累。
6:網站更新頻率的穩定性。
7:服務器或空間的穩定性與快速性。
8:各種型關鍵詞所帶來的網站流量。
9:各種型關鍵詞的排名狀況,通常狀況下,關鍵詞排名越高,網站的權重就會越高。
10:收錄,收錄比越高,被檢索的內容纔會更多,權重纔會越高。
11:有排名的關鍵詞數量,海量有排名的關鍵詞纔會提高網站權重。
12:用戶行爲,用戶點擊機率越大,瀏覽深度越深,瀏覽頁面越廣,相應的權重會更高。
複製代碼
robots.txt協議文件有什麼用
搜索引擎訪問一個網站的時候,最早訪問的文件就是robots.txt。她告訴搜索引擎蜘蛛,哪些網站頁面能夠被抓取,哪
些禁止抓取。表面來看,這個功能做用有限。從搜索引擎優化的角度來看,能夠經過屏蔽頁面,達到集中權重的做用;
複製代碼
設置robots.txt的緣由
1:設置訪問權限保護網站安全。
2:禁止搜索引擎爬取無效頁面,集中權值到主要頁面。
複製代碼
標準寫法書寫協議
例子以下:
User-agent表示定義哪一個搜索引擎,如User-agent:Baiduspider,定義百度蜘蛛;
Disallow表示禁止訪問;
Allow表示運行訪問;
複製代碼
經過以上三個命令,能夠組合多種寫法,容許哪一個搜索引擎訪問或禁止哪一個頁面。
例子:
一、容許全部搜索引擎訪問
User-agent: *
Disallow:
或者
User-agent: *
Allow: /
二、禁止全部搜索引擎訪問
User-agent: *
Disallow: /
或者
User-agent: *
allow:
三、只容許搜索引擎E抓取網頁和.gif格式圖片
User-agent: E
Allow: .gif$
Disallow: .jpg$
Disallow: .jpeg$
Disallow: .png$
Disallow: .bmp$
意思是隻容許抓取網頁和gif格式圖片,不容許抓取其餘格式圖片
複製代碼
存放位置
需放置在網站的根目錄,且對字母大小有限制,文件名必須爲小寫字母。
全部的命令第一個字母需大寫,其他的小寫。且命令以後要有一個英文字符空格;
複製代碼
好比:https://www.baidu.com/robots.txt
哪些時候須要使用該協議
1:無用頁面,不少網站都有聯繫咱們,用戶協議等頁面,這些頁面相對於搜索引擎優化來說,
做用不大,此時須要使用Disallow命令禁止這些頁面被搜索引擎抓取。
2:動態頁面,企業類型站點屏蔽動態頁面,有利於網站安全。且多個網址訪問同一頁面,會形成權重分散。
所以,通常狀況下,屏蔽動態頁面,保留靜態或僞靜態頁面。
3:網站後臺頁面,網站後臺也能夠歸類於無用頁面,禁止收錄有百益而無一害。
複製代碼
sitemap.xml做用
sitemap.xml是一個網站地圖文件,方便爬蟲尋找爬取路徑的一個地圖;
sitemap.xml的做用是給搜索引擎看的,當蜘蛛很難爬行咱們更深層次的內容的時候,
只要有這個就能讓蜘蛛按照順序進行爬取了,加大蜘蛛對網站的任何,增長收錄;
複製代碼
304 Not Modified
簡單理解:
網站304錯誤狀態碼是當客戶端嘗試訪問服務器同一頁面的時候,若是二次訪問的時候,頁面
內容並無發生改變,那麼服務器就會返回304狀態碼,嚴格來講,這不是一個錯誤;
複製代碼
304產生的緣由
1)頁面長時間不更新
若是頁面內容長時間不更新,好比靜態頁面,那麼基本上就會直接返回302,及時是動態頁面,
內容沒有變化, 同樣會返回304;
2)CDN緩存
當開啓CDN加速的時候了,即便頁面內容發生了變化,可是CDN緩存沒有更新,仍然可能會產生這個問題,
解決方案就是設置CDN按期更新的時間;
複製代碼
304對SEO的影響
304不等同於404,理論上不會由於網站任何頁面大量出現304狀態碼產生而產生懲罰行爲,但若是頁面長時間出現
304,那麼會影響搜索引擎對網站的信任評級;
可能形成的影響:
1)百度蜘蛛抓取頻率逐漸下降
2)新增內容頁面, 收錄緩慢,或者網站不收錄
3)關鍵詞排名逐漸平穩降低
複製代碼
關於304常見的問題
1)首頁出現304,會被懲罰碼?
不會被懲罰,但隨着時間的推移會下降信任度
2)如何解決304問題
保持持續穩定的更新,注意網站結構設計,利用新增內容,以及隨機內容,確保每一個欄目都會更新
複製代碼
301是什麼
頁面永久性移走(301重定向)是一種很是重要的「自動轉向」技術。網址重定向最爲可行的一種辦法。
當用戶或搜索引擎向網站服務器發出瀏覽請求時,服務器返回的HTTP數據流中頭信息(header)中的狀態碼的一種,
表示本網頁永久性轉移到另外一個地址。
複製代碼
改版
通常來說,網站改版分爲兩種。
一種是前端頁面改版。另一種是連接結構發生變化如更換建站系統的改版。
前者不用使用301,後者則必須使用301。
注:即便是前端頁面的改版,也會對主網站的流量形成影響,
其中的緣由應該是關鍵詞的位置與頻次由於頁面的變化而發生了變化。
複製代碼
改版的建議
1)預估網站經歷改版所形成的損失
2)肯定必定以及確定使用301永久重定向,不要使用301跳轉
3)很是十分以及極其要求使用百度站長平臺的「網站改版」工具
4)經過百度站長平臺的連接提交工具,指引爬蟲爬取更新後的網址url
5)注意觀察百度站長平臺的索引量數據
複製代碼
帶www和不帶www的域名重定向
通常域名都會解析成帶www和不帶www的URL,其實不帶www的纔是主域。
由於兩個不一樣的訪問地址都能訪問主頁,搜索引擎會認爲這是兩個相同的頁面,權重分散。
至於把哪個定位到另外一個,因人而異。大多數人接受帶www的網址,認爲「比較專業」。
新購買的空間都有一個臨時的訪問地址,若是不當心向搜索引擎提交了該地址,
但是一件麻煩事,不只影響到了真正主域名的權重,還不必定刪除得了。
複製代碼
什麼是關鍵詞
從百科的定義來看,關鍵詞是英文「keywords」的翻譯結果,,指的是用戶在搜索引擎中鍵入的,
表達用戶個體需求的詞彙。從wikipedia的定義來看,它的意思是用戶獲取信息的一種精簡的詞彙。
實際上,這兩個定義所表達的意思是同樣的,只是在表述上不一樣罷了。
假設你在使用百度,你想經過某個關鍵詞獲取信息,那麼你鍵入的詞彙均可以叫作關鍵詞。
複製代碼
關鍵詞和搜索引擎的關係
搜索引擎的工做原理,具體可歸納爲爬行和抓取—》創建索引—》搜索詞處理—》排序;
搜索引擎蜘蛛無時無刻不在爬行和抓取新鮮網頁內容,在此以後,會對有價值的網頁內容創建索引,
當用戶在搜索引擎中輸入關鍵詞後,會經過分詞等技術瞭解用戶的真實搜索意圖,
並在結果中以排序的方式爲用戶提供列表型的結果。
複製代碼
通常而言,就是網站的TKD信息,即title、keywords、description;
相對精準的命令「ping」
Ping命令有兩個做用,一是測試網絡是否通暢,二是測試網站的加載速度。
使用方法也很簡單,以Windows XP爲例,點擊開始–》點擊運行–》在對話框中輸入cmd,在點擊肯定。無
論什麼系統,進入DOS是最重要的步驟。一旦進入DOS,
就須要鍵入ping 你的站點(注意中間有一個空格),此時就會出現相應界面。
複製代碼
從ping結果頁面能夠顯示,你的站點ip是多少,有多少字節,發送數據包最短的時間,最長的時間與平均時間。
實際上,咱們只須要查看倒數第二行,看數據包往返行程的平均時間便可,
此圖中,平均時間爲48ms(毫秒),速度較快。經過此命令,能夠判斷你須要測試的網站速度,推薦使用。
複製代碼
使用站長工具對網站進行速度測試
http://tool.chinaz.com/speedtest/
相對於本機,它提供多個地點ping服務器的功能,從理論上講,測試結果會更加合理。
使用方法也較簡單,打開站長工具相應頁面,在輸入框中輸入你的站點,點擊網站測速便可。如圖:
複製代碼
綜合考慮,採用跳轉適配(兩套模版,不一樣URL、相同TKD)相結合的方法實現多屏和多瀏覽器兼容。
全站使用絕對連接:好比 <a href=「http://www.baidu.cn/news/372.html" target="_blank">
首選域設置:更新各個頁面中指向首頁的目標URL,好比導航菜單、麪包屑(位置路徑)、錨文本等。
備註:301重定向表示永久性跳轉,搜索引擎會把原來對於A頁面的排名權重轉移到B頁面上去,平穩過 渡,而後在搜索引擎的數據庫中刪除A頁面,替換成B頁面。
慎用二級域名:除了WAP站外,其餘任何頁面都不使用二級域名。
如下文字或圖片的(a)連接,須要添加nofollow:
一級導航菜單的連接,在當前窗口打開: (a href="#" target="_self")其餘連接則在新窗口打開;(a href="#" target="_blank")
除非連接中的文字顯示不完整,須要由程序在(a)連接中添加title,不然不須要添加,以下圖所示。 對於 "更多" 的(a)連接,由程序添加title,(<)a href="#" title="更多買房貸款攻略">)''
空白區域不可點擊
首頁和頻道首頁爲人工設置,欄目列表頁和詳情頁則爲程序生成,具體規則見Excel文檔-URL部分。 建議:不要改變任何頁面的URL規則!如需修改,必需與SEO顧問協商確認,避免操做不當被降權。
URL設置遵循:
WAP站首頁:http://m.baidaibao.cn/,而WAP站內頁的URL與PC站的內頁相同。
在html代碼中連着一塊兒,並位於靠前位置。
原則上,全部頁面的TKD不能頻繁改變,如需修改,須與seo顧問協商確認,避免出現收錄和排名降低。
A. 須要編輯設置的文章TKD,參考如下建議進行設置。to編輯:
404錯誤頁面
死連接
請使用普通的css樣式(如span、div等)定義。 相關建議:
Canonical標籤
對一組內容徹底相同或高度類似的頁面(好比列表分頁),經過Canonical標籤告訴爬蟲哪一個頁面爲規範 !4 網頁,避免搜索結果中出現多個內容相同或類似的頁面,解決重複內容的收錄問題,避免權重的分散。
在每一個非規範版本的html頁面的,添加 rel="canonical" 連接可指定規範網址: (link rel="canonical" href="http://www.baidu.cn/game/hot-0-0-0-0-0/"/)
全部文章頁的正文第一次出現關鍵字時,由程序自動匹配錨文本連接到對應的頁面,不重複添加連接。
錨文本連接優先指向:
須要具有較豐富的內容、較多的收錄、較高的權重,交換的成功率才高一些,預計上線3個月啓動。
交換優先級:PC首頁、{城市}貸款頻道、其餘頻道、其餘頁面。
不一樣階段的交換策略有所不一樣,體如今百度權重值的要求,如下規則將不按期更新。
如下是友鏈交換的通用方案:
◇ PC站首頁: 1
WAP站首頁:
{城市}貸款頻道:
花了點時間整理了下資料,有一半內容是公司有個SEO顧問整理的~ 經過這些資料,也算是對SEO總體有更多的認識,其中robots.txt是此次猜中的坑,直接影響是百度不會對網站內容進行收錄,會致使以前的全部工做功虧一簣~
謝謝你們~