1、什麼是網站日誌瀏覽器
WEB 日誌是網站的WEB服務處理程序,根據必定的規範生成的ASCII文本。它主要記錄了網站訪問記錄數據內容,是網站分析和網站數據倉庫的數據基礎來源。服務器
網站分析和數據分析也將對SEO產生必定的影響,經過WEB日誌,咱們能夠看到各大搜索引擎蜘蛛對網站的抓取狀況,這對SEO工做是很是重要的。因此瞭解WEB日誌的格式和組成將有利於咱們更好地進行網站數據的收集、處理和分析,從而更好的進行網站優化。cookie
2、日誌文件的類型優化
目前常見的WEB日誌格式主要由兩類,一類是Apache的NCSA日誌格式,另外一類是IIS的W3C日誌格式。NCSA格式又分爲NCSA普通日誌格式 (CLF)和NCSA擴展日誌格式(ECLF)兩類,目前最經常使用的是NCSA擴展日誌格式(ECLF)及基於自定義類型的Apache日誌格式;而W3C 擴展日誌格式(ExLF)具有了更爲豐富的輸出信息,主要是微軟IIS(Internet Information Services)中應用。網站
3、W3C擴展WEB日誌分析搜索引擎
下面是一段常見的IIS生產的W3C擴展WEB日誌spa
2011-09-01 16:02:22 GET /Enterprise/detail.asp 70.25.29.53 http:/ /www .example.com/searchout.asp 202 17735 369 4656代理
這個日誌能夠解讀爲:IP是70.25.29.53,來自"http://www.example.com/searchout.asp"的訪客,在2011-09-01 16:02:22,訪問(GET)了主機的/Enterprise/detail.asp,訪問成功,獲得17735字節數據。日誌
日期:date 動做發生時的日期。code
時間:time 動做發生時的時間(默認爲UTC標準)。
客戶端IP地址:c-ip 訪問服務器的客戶端IP地址。
用戶名:cs-username 經過身份驗證的訪問服務器的用戶名。不包括匿名用戶(用‘-’表示)。
服務名:s-sitename 客戶所訪問的Internet服務名以及實例號。
服務器名:s-computername 產生日誌條目的服務器的名字。
服務器IP 地址:s-ip 產生日誌條目的服務器的IP地址。
服務器端口:s-port 服務端提供服務的傳輸層端口。
方法:cs-method 客戶端執行的行爲(主要是GET與POST行爲)。
URI Stem:cs-uri-stem 被訪問的資源,如Default.asp等。
URI Query:cs-uri-query 客戶端提交的參數(包括GET與POST行爲)。
協議狀態:sc-status 用HTTP或者FTP術語所描述的、行爲執行後的返回狀態。
Win32狀態:sc-win32-status 用Microsoft Windows的術語所描述的動做狀態。
發送字節數:sc-bytes 服務端發送給客戶端的字節數。
接受字節數:cs-bytes 服務端從客戶端接收到的字節數。
花費時間:time-taken 執行這次行爲所消耗的時間,以毫秒爲單位。
協議版本:cs-version 客戶端所用的協議(HTTP、FTP)版本。對HTTP協議來講是HTTP 1.0或者HTTP 1.1。
主機:cs-host 客戶端的HTTP報頭(host header)信息。
用戶代理:cs(User-Agent) 客戶端所用的瀏覽器版本信息。
Cookie:cs(Cookie) 發送或者接受到的cookie內容。
Referrer:cs(Referer) 用戶瀏覽的前一個網址,當前網址是從該網址連接過來的。
協議底層狀態:sc-substatus 協議底層狀態的一些錯誤信息。
笨鳥先飛早入林,笨人勤學早成材。
轉載請註明出處:
撰寫人:fox-yu http://www.cnblogs.com/fox-yu/