HTTPS(Secure Hypertext Transfer Protocol)--安全超文本傳輸協議 它是由Netscape開發並內置於其瀏覽器中,用於對數據進行壓縮和解壓操做,並返回網絡上傳送回的結果。 HTTPS實際上應用了Netscape的徹底套接字層(SSL)做爲HTTP應用層的子層。(HTTPS使用端口443, 而不是象HTTP那樣使用端口80來和TCP/IP進行通訊。)SSL使用40 位關鍵字做爲RC4流加密算法, 這對於商業信息的加密是合適的。HTTPS和SSL支持使用X.509數字認證,若是須要的話用戶能夠確認發送者是誰。
WWW的核心——HTTP協議 衆所周知,Internet的基本協議是TCP/IP協議,目前普遍採用的FTP、Archie Gopher等是創建在TCP/IP協議之上的應用層協議,不一樣的協議對應着不一樣的應用。<BR> WWW服務器使用的主要協議是HTTP協議,即超文體傳輸協議。因爲HTTP協議支持的服務不限於WWW,還能夠是其它服務,於是HTTP協議容許用戶在統一的界面下,採用不一樣的協議訪問不一樣的服務,如FTP、Archie、SMTP、NNTP等。另外,HTTP協議還可用於名字服務器和分佈式對象管理。 2.1 HTTP協議簡介 HTTP是一個屬於應用層的面向對象的協議,因爲其簡捷、快速的方式,適用於分佈式超媒體信息系統。它於1990年提出,通過幾年的使用與發展,獲得不斷地完善和擴展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規範化工做正在進行之中,並且HTTP-NG(Next Generation of HTTP)的建議已經提出。 HTTP協議的主要特色可歸納以下: 1.支持客戶/服務器模式。 2.簡單快速:客戶向服務器請求服務時,只需傳送請求方法和路徑。請求方法經常使用的有GET、HEAD、POST。每種方法規定了客戶與服務器聯繫的類型不一樣。 因爲HTTP協議簡單,使得HTTP服務器的程序規模小,於是通訊速度很快。 3.靈活:HTTP容許傳輸任意類型的數據對象。正在傳輸的類型由Content-Type加以標記。 4.無鏈接:無鏈接的含義是限制每次鏈接只處理一個請求。服務器處理完客戶的請求,並收到客戶的應答後,即斷開鏈接。採用這種方式能夠節省傳輸時間。 5.無狀態:HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力。缺乏狀態意味着若是後續處理須要前面的信息,則它必須重傳,這樣可能致使每次鏈接傳送的數據量增大。另外一方面,在服務器不須要先前信息時它的應答就較快。 2.2 HTTP協議的幾個重要概念 1.鏈接(Connection):一個傳輸層的實際環流,它是創建在兩個相互通信的應用程序之間。 2.消息(Message):HTTP通信的基本單位,包括一個結構化的八元組序列並經過鏈接傳輸。 3.請求(Request):一個從客戶端到服務器的請求信息包括應用於資源的方法、資源的標識符和協議的版本號 4.響應(Response):一個從服務器返回的信息包括HTTP協議的版本號、請求的狀態(例如「成功」或「沒找到」)和文檔的MIME類型。 5.資源(Resource):由URI標識的網絡數據對象或服務。 6.實體(Entity):數據資源或來自服務資源的回映的一種特殊表示方法,它可能被包圍在一個請求或響應信息中。一個實體包括實體頭信息和實體的自己內容。 7.客戶機(Client):一個爲發送請求目的而創建鏈接的應用程序。 8.用戶代理(User agent):初始化一個請求的客戶機。它們是瀏覽器、編輯器或其它用戶工具。 9.服務器(Server):一個接受鏈接並對請求返回信息的應用程序。 10.源服務器(Origin server):是一個給定資源能夠在其上駐留或被建立的服務器。 11.代理(Proxy):一箇中間程序,它能夠充當一個服務器,也能夠充當一個客戶機,爲其它客戶機創建請求。請求是經過可能的翻譯在內部或通過傳遞到其它的服務器中。一個代理在發送請求信息以前,必須解釋而且若是可能重寫它。 代理常常做爲經過防火牆的客戶機端的門戶,代理還能夠做爲一個幫助應用來經過協議處理沒有被用戶代理完成的請求。 12.網關(Gateway):一個做爲其它服務器中間媒介的服務器。與代理不一樣的是,網關接受請求就好象對被請求的資源來講它就是源服務器;發出請求的客戶機並無意識到它在同網關打交道。 網關常常做爲經過防火牆的服務器端的門戶,網關還能夠做爲一個協議翻譯器以便存取那些存儲在非HTTP系統中的資源。 13.通道(Tunnel):是做爲兩個鏈接中繼的中介程序。一旦激活,通道便被認爲不屬於HTTP通信,儘管通道多是被一個HTTP請求初始化的。當被中繼的鏈接兩端關閉時,通道便消失。當一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通信時通道被常用。 14.緩存(Cache):反應信息的局域存儲。 2.3 HTTP協議的運做方式 HTTP協議是基於請求/響應範式的。一個客戶機與服務器創建鏈接後,發送一個請求給服務器,請求方式的格式爲,統一資源標識符、協議版本號,後邊是MIME信息包括請求修飾符、客戶機信息和可能的內容。服務器接到請求後,給予相應的響應信息,其格式爲一個狀態行包括信息的協議版本號、一個成功或錯誤的代碼,後邊是MIME信息包括服務器信息、實體信息和可能的內容。 許多HTTP通信是由一個用戶代理初始化的而且包括一個申請在源服務器上資源的請求。最簡單的狀況多是在用戶代理(UA)和源服務器(O)之間經過一個單獨的鏈接來完成(見圖2-1)。 圖2-1 當一個或多箇中介出如今請求/響應鏈中時,狀況就變得複雜一些。中介由三種:代理(Proxy)、網關(Gateway)和通道(Tunnel)。一個代理根據URI的絕對格式來接受請求,重寫所有或部分消息,經過URI的標識把已格式化過的請求發送到服務器。網關是一個接收代理,做爲一些其它服務器的上層,而且若是必須的話,能夠把請求翻譯給下層的服務器協議。一個通道做爲不改變消息的兩個鏈接之間的中繼點。當通信須要經過一箇中介(例如:防火牆等)或者是中介不能識別消息的內容時,通道常常被使用。 圖2-2 上面的圖2-2代表了在用戶代理(UA)和源服務器(O)之間有三個中介(A,B和C)。一個經過整個鏈的請求或響應消息必須通過四個鏈接段。這個區別是重要的,由於一些HTTP通信選擇可能應用於最近的鏈接、沒有通道的鄰居,應用於鏈的終點或應用於沿鏈的全部鏈接。儘管圖2-2是線性的,每一個參與者均可能從事多重的、併發的通信。例如,B可能從許多客戶機接收請求而不經過A,而且/或者不經過C把請求送到A,在同時它還可能處理A的請求。 任何針對不做爲通道的匯聚可能爲處理請求啓用一個內部緩存。緩存的效果是請求/響應鏈被縮短,條件是沿鏈的參與者之一具備一個緩存的響應做用於那個請求。下圖說明結果鏈,其條件是針對一個未被UA或A加緩存的請求,B有一個通過C來自O的一個前期響應的緩存拷貝。 圖2-3 在Internet上,HTTP通信一般發生在TCP/IP鏈接之上。缺省端口是TCP 80,但其它的端口也是可用的。但這並不預示着HTTP協議在Internet或其它網絡的其它協議之上才能完成。HTTP只預示着一個可靠的傳輸。 以上簡要介紹了HTTP協議的宏觀運做方式,下面介紹一下HTTP協議的內部操做過程。 首先,簡單介紹基於HTTP協議的客戶/服務器模式的信息交換過程,如圖2-4所示,它分四個過程,創建鏈接、發送請求信息、發送響應信息、關閉鏈接。 圖2-4 在WWW中,「客戶」與「服務器」是一個相對的概念,只存在於一個特定的鏈接期間,即在某個鏈接中的客戶在另外一個鏈接中可能做爲服務器。WWW服務器運行時,一直在TCP80端口(WWW的缺省端口)監聽,等待鏈接的出現。 下面,討論HTTP協議下客戶/服務器模式中信息交換的實現。 1.創建鏈接 鏈接的創建是經過申請套接字(Socket)實現的。客戶打開一個套接字並把它約束在一個端口上,若是成功,就至關於創建了一個虛擬文件。之後就能夠在該虛擬文件上寫數據並經過網絡向外傳送。 2.發送請求 打開一個鏈接後,客戶機把請求消息送到服務器的停留端口上,完成提出請求動做。 HTTP/1.0 請求消息的格式爲: 請求消息=請求行(通用信息|請求頭|實體頭) CRLF[實體內容] 請求 行=方法 請求URL HTTP版本號 CRLF 方 法=GET|HEAD|POST|擴展方法 U R L=協議名稱+宿主名+目錄與文件名 請求行中的方法描述指定資源中應該執行的動做,經常使用的方法有GET、HEAD和POST。不一樣的請求對象對應GET的結果是不一樣的,對應關係以下: 對象 GET的結果 文件 文件的內容 程序 該程序的執行結果 數據庫查詢 查詢結果 HEAD——要求服務器查找某對象的元信息,而不是對象自己。 POST——從客戶機向服務器傳送數據,在要求服務器和CGI作進一步處理時會用到POST方法。POST主要用於發送HTML文本中FORM的內容,讓CGI程序處理。 一個請求的例子爲: GET http://networking.zju.edu.cn/zju/index.htm HTTP/1.0 頭信息又稱爲元信息,即信息的信息,利用元信息能夠實現有條件的請求或應答 。 請求頭——告訴服務器怎樣解釋本次請求,主要包括用戶能夠接受的數據類型、壓縮方法和語言等。 實體頭——實體信息類型、長度、壓縮方法、最後一次修改時間、數據有效期等。 實體——請求或應答對象自己。 3.發送響應 服務器在處理完客戶的請求以後,要向客戶機發送響應消息。 HTTP/1.0的響應消息格式以下: 響應消息=狀態行(通用信息頭|響應頭|實體頭) CRLF 〔實體內容〕 狀 態 行=HTTP版本號 狀態碼 緣由敘述 狀態碼錶示響應類型 1×× 保留 2×× 表示請求成功地接收 3×× 爲完成請求客戶需進一步細化請求 4×× 客戶錯誤 5×× 服務器錯誤 響應頭的信息包括:服務程序名,通知客戶請求的URL須要認證,請求的資源什麼時候能使用。 4.關閉鏈接 客戶和服務器雙方均可以經過關閉套接字來結束TCP/IP對話