百度sitemap常見問題

1、什麼是Sitemap?html

Sitemap(即站點地圖)就是您網站上各網頁的列表。建立並提交Sitemap有助於百度發現並瞭解您網站上的全部網頁。您還可使用Sitemap提供有關您網站的其餘信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。api

百度對已提交的數據,不保證必定會抓取及索引全部網址。可是,咱們會使用Sitemap中的數據來了解網站的結構等信息,這樣能夠幫助咱們改進抓取策略,並在往後能更好地對網站進行抓取。服務器

此外,Sitemap 與搜索排名沒有關係。 網絡

 2、百度Sitemap協議都支持哪些格式?ide

百度Sitemap協議支持三種格式:文本格式、xml格式、Sitemap索引格式,能夠根據本身狀況來選擇任意一種格式組織sitemap。具體格式說明及示例以下: 工具

1.第一種格式樣例:txt文本格式網站

在一個txt文本列明須要向百度提交的連接地址,將txt文本文件經過站長平臺進行提交    編碼

http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html  
url

此文本文件須要遵循如下指南:
spa

  • 文本文件每行都必須有一個網址。網址中不能有換行。不該包含網址列表之外的任何信息。                       

  • 您必須書寫完整的網址,包括 http。

  • 每一個文本文件最多可包含 50,000 個網址,而且應小於10MB(10,485,760字節)。若是網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,而後分別添加每一個文件。

  • 文本文件需使用 UTF-8 編碼或GBK編碼。                                                              

2.第二種格式樣例:xml格式

單個xml數據格式以下:

 

<?xml version=" 1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
< urlset>
<!--必填標籤-->
    <url>
        <!--必填標籤,這是具體某一個連接的定義入口,每一條數據都要用<url>和</url>包含在裏面,這是必須的 -->
        <loc>http://www.yoursite.com/yoursite.html</loc>
        <!--必填,URL連接地址,長度不得超過256字節-->
        <lastmod>2009-12-14</lastmod>
        <!--能夠不提交該標籤,用來指定該連接的最後更新時間-->
        <changefreq>daily</changefreq>
        <!--能夠不提交該標籤,用這個標籤告訴此連接可能會出現的更新頻率 -->
        <priority>0.8</priority>
        <!--能夠不提交該標籤,用來指定此連接相對於其餘連接的優先權比值,此值定於0.0-1.0之間-->
    </url>
    <url>
        <loc>http://www.yoursite.com/yoursite2.html</loc>
        <lastmod>2010-05-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</ urlset>

上述Sitemap向百度提交了一個url:http://www.yoursite.com/yoursite.html 

如有多條url,按照上述格式重複<url></url>之間的片段,列明全部url地址,打包到一個xml文件,向站長平臺進行提交。

3.第三種格式樣例:Sitemap索引格式

如需提交大量sitemap文件,則可將其列在sitemap索引文件中,而後將該索引文件提交。您無需分別提交每一個文件。

 

<?xml version=" 1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<sitemapindex>
<!--必填,以 <sitemapindex> 開始標記做爲開始,以 </sitemapindex> 結束標記做爲結束-->
    <sitemap>
        <!--必填,以<sitemap>標籤提交一個子sitemap文件-->
        <loc><loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
        <!--必填,識別sitemap的位置-->
        <lastmod>2009-12-14</lastmod>
        <!--選填,識別相對sitemap文件的修改時間-->

    </sitemap>

必填,標籤閉合</sitemapindex>

必填,標籤閉合有多個Sitemap,按上述格式重複<sitemap></sitemap>之間的片段,列明全部Sitemap地址,向站長平臺進行提交。

3、什麼是移動Sitemap協議,如何提交Sitemap到移動搜索?

百度推出了移動Sitemap協議,用於將網址提交給移動搜索收錄。百度移動Sitemap協議是在標準Sitemap協議基礎上制定的,增長了<mobile:mobile/>標籤,它有三種取值:

  • <mobile:mobile/> :移動網頁

  • <mobile:mobile type="mobile"/> :移動網頁      

  • <mobile:mobile type="autoadapt"/>:自適配網頁,適用於同一網址頁面,會隨設備不一樣改變展示的狀況。        

無該標籤表示PC的網頁

下 方樣例至關於向百度移動搜索提交了一個移動網頁:http://m.example.com/index.html,向PC搜索提交了一個傳統網 頁:http://www.example.com/index.html,同時向移動搜索和PC搜索提交了一個自適配網頁http: //www.example.com/autoadapt.html:

<?xml version="1.0" encoding="UTF-8" ?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/"> 
<url> 
<loc>http://m.example.com/index.html</loc> 
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/index.html</loc>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
<url> 
<loc>http://www.example.com/autoadapt.html</loc> 
<mobile:mobile type="autoadapt"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url> 
</urlset>

提交Sitemap到移動搜索的方法,參考第四條,按照移動Sitemap協議作好Sitemap後,在Sitemap工具點擊添加新數據提交,與提交普通Sitemap方式一致。

4、建立sitemap時有哪些注意事項?如何提交sitemap?

注意事項

  • 一個Sitemap文件包含的網址不得超過 5 萬個,且文件大小不得超過 10 MB。若是您的Sitemap超過了這些限值,請將其拆分爲幾個小的Sitemap。這些限制條件有助於確保您的網絡服務器不會因提供大文件而超載。

  • 一次性最多提交50個地址,提交地址的文件類型和更新週期必須一致。

  • 若是驗證了網站的主域,那麼Sitemap文件中可包含該網站主域下的全部網址。

  • 若是驗證的www.example.com,你只能提交該驗證網站的網址,不能出現其餘網站的網址。

提交步驟

  1. 將需提交的網頁列表製做成一個Sitemap文件,文件格式請閱讀百度Sitemap協議都支持哪些格式。

  2. 將Sitemap文件放置在網站目錄下。好比您的網站爲example.com,您已製做了一個sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網站根目錄即example.com/sitemap_example.xml

  3. 登陸百度站長平臺,確保提交Sitemap數據的網站已驗證歸屬。

  4. 進入Sitemap工具,點擊「添加新數據」,文件類型選擇「URL列表」,填寫抓取週期和Sitemap文件地址

提交完以後,可在Sitemap列表裏看到提交的Sitemap文件,若是Sitemap文件裏面有新的網站連接,能夠選擇文件後,點擊更新所選,即對更新的網站連接進行了提交。

5、我提交時填寫的週期是什麼含義?

百度Spider會參考設置週期抓取Sitemap文件,所以請根據Sitemap文件內容的更新(好比增長新url)來設置。請注意若url不變而僅是url對應的頁面內容更新(好比論壇帖子頁有新回覆內容),不在此更新範圍內。Sitemap工具不能解決頁面更新問題。

6、Sitemap提交後,多久能被百度處理?

Sitemap數據提交後,通常在1小時內百度會開始處理。處理完成的時間視文件大小和您設置的抓取週期而定。

7、提交的Sitemap都會被百度抓取並收錄嗎?

百度對已提交的數據,不保證必定會抓取及收錄全部網址。是否收錄與頁面質量相關。

8、我能夠壓縮個人 Sitemap 嗎?它們是否須要用 gzip 壓縮?

能夠。請使用 gzip 壓縮 Sitemap。不管壓縮與否,Sitemap 應該小於 10MB(10,485,759字節)。

9、XML格式的 Sitemap 中,「priority」提示會影響個人網頁在搜索結果中的排名嗎?

不會。Sitemap 中的「priority」提示只是說明該網址相對於您本身網站上其餘網址的重要性,並不會影響網頁在搜索結果中的排名。

10、網址在 Sitemap 中的位置是否會影響它的使用?

不會。網址在 Sitemap 中的位置並不會影響百度對它的識別或使用方式。

11、Sitemap中提交的url可否包含中文?

由於轉碼問題建議最好不要包含中文。

相關文章
相關標籤/搜索