關於織夢DEDECMS robots文件設置的想法

織夢DEDECMS建站的站長會發現,DEDECMS自帶的robots.txt文件設置很簡單(開發者基於每一個網站的目錄結構和優化目的不一樣的 考慮),並不能徹底知足網站的優化要求,那怎樣才能結合本身網站的狀況,作好robots.txt優化呢?如下介紹一點本身的想法,僅供參考。 php

適用於未僞靜態的DEDECMS網站。 html

User-agent: * web

Disallow: /dede 管理後臺目錄,須要更名,具體設置後面具體講 緩存

Disallow: /include 程序核心文件目錄 安全

Disallow: /member 會員管理目錄,有些文件能夠開放 工具

Disallow: /plus 插件及輔助功能目錄 ,有些文件能夠開放,如search.php 測試

Disallow: /templets 默認模板存放目錄 優化

Disallow: /data 系統緩存或其它可寫入數據存放目錄 網站

Disallow: /uploads 上傳下載文件保存目錄,不想搜索引擎引用圖片的話,禁止 搜索引擎

Disallow: /images 系統默認模板圖片存放目錄

Disallow: /index.php 網站默認首頁,靜態化的話,最好禁止

Disallow: /404.html

Allow: /plus/search.php 開放禁止目錄裏的具體文件

...

基本設置就是這樣,下面着重講下後臺管理目錄和欄目頁的設置:

1.dede 目錄,爲了網站安全考慮須要更名。然而更名以後,你們難免疑惑:改了名,在robots.txt文件裏怎麼設置呢?直接禁止抓取,仍是泄露了後臺目錄,等 於更名無效。那麼該如何解決這個問題呢?咱們能夠經過下面的設置解決這個問題,如後臺目錄爲dedecms:

Disallow: /d*ms

這樣咱們就能即禁止了搜索引擎的抓取,又不會泄露了後臺目錄名稱。

2. 欄目頁。有些人會注意到,若是網站不作僞靜態優化的話,欄目分頁後會有兩個連接指向欄目首頁,如*/web/和*/web/list_1_1.html, 爲了網站優化,建議先將欄目分頁優化如下(具體作法你們能夠在網上找),把首頁和第一頁的連接改成*/web/的形式,而後在robots.txt文件裏 作如下設置:

Disallow: /*1.html$

以上就是DEDECMS robots.txt文件的設置,你們能夠根據本身網站的狀況具體設置。

注意事項:

1.按官方說明設置好目錄權限;

2.後臺目錄改後的名稱開頭字母和結尾字母不要和其餘目錄同樣;

3.用百度站長工具測試一下robots.txt文件設置是否有效。

本文由http://www.1886sj.com編輯。

相關文章
相關標籤/搜索