簡單描述Web應用程序的本質,就是咱們經過瀏覽器訪問互聯網上指定的網頁文件展現到瀏覽器上。python
流程以下圖: web
從更深層次一點的技術角度來看,由如下幾個步驟:編程
HTTP協議是咱們經常使用的五層協議中的應用層(5層從上到下是應用層,傳輸層,網絡層,數據鏈路層,物理層),HTTP協議中協定的內容稱之爲消息,消息主要包括消息頭——Header和消息體——Body。 客戶端請求時的消息稱爲Request,服務端響應時的消息稱爲Response.瀏覽器
Header:包括請求方法,HTTP版本,URI,狀態碼,COOKIE等 Body:是響應或者請求時的內容,包含HTML,CSS,JS等bash
HTTP協議這裏就不作過多的描述,能夠到點擊這裏深刻了解HTTP協議服務器
簡單點說,HTML 是一種由不一樣元素組成的標記語言,它定義了網頁內容的含義和結構,全部咱們在瀏覽器中看到的內容都是由一個一個的元素組成。除 HTML 之外的其它技術則一般用來描述一個網頁的表現與展現效果(如 CSS),或功能與行爲(如 JavaScript)。網絡
HTML就再也不往深處描述,能夠到點擊這裏深刻了解HTML多線程
直接將寫好的HTML頁面放在服務器上,而後直接經過瀏覽器訪問指定服務器的文件。
複製代碼
隨着咱們的需求變化單獨使用靜態開發已經不能徹底知足咱們。
例如咱們查看的頁面只有部份內容會變化,那咱們再去開發相同的頁面。
一是開發上是一種重複工做,徹底是一種浪費。
二是數據量變化巨大時,徹底是跟不上速度,而且數據變化也不是定時更新。
爲了應對這種問題,動態網頁技術也就誕生了。早期的動態網頁開發技術是CGI
CGI全稱:Common Gateway Interface,通用網關接口,它是一段程序,運行在服務器上如:HTTP 服務器,
提供同客戶端 HTML 頁面的接口。
CGI 程序能夠是 Python 腳本,PERL 腳本,SHELL 腳本,C 或者 C++ 程序等。
各類編程語言也針對動態網頁開發給出不一樣的解決方案,JAVA的servlet,Python的WSGI協議等。
複製代碼
Python的WSGI協議也是咱們本章要講的內容app
CGI流程框架
WSGI的流程
WSGI全稱是Web Server Gateway Interface,其主要做用是Web服務器與Python Web應用程序或框架之間的建議標準接口,以促進跨各類Web服務器的Web應用程序可移植性。
WSGI並非框架而只是一種協議,咱們能夠將WSGI協議分紅三個組件Application,Server,Middleware和協議中傳輸的內容。
將這三個組件對映射到咱們具體使用的組件是:
Server:經常使用的有uWSGI,gunicorn等 Application:Django,Flask等 Middleware: Flask等框架中的裝飾器
應用程序,是一個可重複調用的可調用對象,在Python中能夠是一個函數,也能夠是一個類,若是是類的話要實現__call__方法,要求這個可調用對象接收2個參數,返回一個內容結果
接收的2個參數分別是environ和start_response。
environ是web服務器解析HTTP協議的一些信息,例如請求方法,請求URI等信息構成的一個Dict對象。
start_response是一個函數,接收2個參數,一個是HTTP狀態碼,一個HTTP消息中的響應頭。
依照官方提供的示例用函數實現應用程序
def simple_app(environ, start_response):
"""Simplest possible application object"""
status = '200 OK'
response_headers = [('Content-type', 'text/plain; charset=utf-8')]
start_response(status, response_headers)
return_body = []
for key, value in environ.items():
return_body.append("{} : {}".format(key, value))
return_body.append("\nHello WSGI!")
# 返回結果必須是bytes
return ["\n".join(return_body).encode("utf-8")]
複製代碼
Web服務器,主要是實現相應的信息轉換,將網絡請求中的信息,按照HTTP協議將內容拿出,同時按照WSGI協議組裝成新的數據,同時將提供的start_response傳遞給Application。最後接收Application返回的內容,按照WSGI協議解析出。最終按照HTTP協議組織好內容返回就完成了一次請求。
Server操做的步驟以下:
下面這個是pep3333協議中的一個server例子,按照CGI請求的方式來實現。
import os, sys
enc, esc = sys.getfilesystemencoding(), 'surrogateescape'
def unicode_to_wsgi(u):
# Convert an environment variable to a WSGI "bytes-as-unicode" string
return u.encode(enc, esc).decode('iso-8859-1')
def wsgi_to_bytes(s):
return s.encode('iso-8859-1')
def run_with_cgi(application):
# 按照WSGI協議,構建environ內容
# 1類 CGI相關的變量,此腳本就是用於cgi執行,因此前面的web服務器已經將CGI變量封裝好,這裏直接使用
environ = {k: unicode_to_wsgi(v) for k,v in os.environ.items()}
# 2類 wsgi定義的變量
environ['wsgi.input'] = sys.stdin.buffer
environ['wsgi.errors'] = sys.stderr
environ['wsgi.version'] = (1, 0)
environ['wsgi.multithread'] = False
environ['wsgi.multiprocess'] = True
environ['wsgi.run_once'] = True
if environ.get('HTTPS', 'off') in ('on', '1'):
environ['wsgi.url_scheme'] = 'https'
else:
environ['wsgi.url_scheme'] = 'http'
headers_set = []
headers_sent = []
def write(data):
# 將內容返回
out = sys.stdout.buffer
if not headers_set:
raise AssertionError("write() before start_response()")
elif not headers_sent:
# Before the first output, send the stored headers
status, response_headers = headers_sent[:] = headers_set
out.write(wsgi_to_bytes('Status: %s\r\n' % status))
for header in response_headers:
out.write(wsgi_to_bytes('%s: %s\r\n' % header))
out.write(wsgi_to_bytes('\r\n'))
out.write(data)
out.flush()
def start_response(status, response_headers, exc_info=None):
if exc_info:
try:
if headers_sent:
# Re-raise original exception if headers sent
raise exc_info[1].with_traceback(exc_info[2])
finally:
exc_info = None # avoid dangling circular ref
elif headers_set:
raise AssertionError("Headers already set!")
headers_set[:] = [status, response_headers]
# Note: error checking on the headers should happen here,
# *after* the headers are set. That way, if an error
# occurs, start_response can only be re-called with
# exc_info set.
return write
# 將上面處理的參數交給應用程序
result = application(environ, start_response)
try:
# 將請求到的結果寫回。
for data in result:
if data: # don't send headers until body appears
write(data)
if not headers_sent:
write('') # send headers now if body was empty
finally:
if hasattr(result, 'close'):
result.close()
複製代碼
中間件,能夠理解爲對應用程序的一組裝飾器。 在應用程序端看來,它能夠提供一個類start_response函數,能夠想start_response函數同樣接收HTTP STATU和Headers;和environ。 在服務端看來,他能夠接收2個參數,而且能夠返回一個類Application對象。 下面看一個例子,記錄每次請求的消耗時間:
import time
class ResponseTimingMiddleware(object):
"""記錄請求耗時"""
def __init__(self, app):
self.app = app
def __call__(self, environ, start_response):
start_time = time.time()
response = self.app(environ, start_response)
response_time = (time.time() - start_time) * 1000
timing_text = "記錄請求耗時中間件輸出\n\n本次請求耗時: {:.10f}ms \n\n\n".format(response_time)
response.append(timing_text.encode('utf-8'))
return response
複製代碼
重點看environ有哪些內容,這裏面纔是瀏覽器每次請求時的信息。再深刻一點探索,就是HTTP請求消息中的請求頭和請求體都是怎麼定義及怎麼回去的。 environ是一個字典,environ中要包含CGI定義的變量,主要是將HTTP協議中的內容,好比請求方法,POST/GET,請求URI等,另外是WSGI協議本身定義的變量,好比請求body中要讀取的信息等。列一下主要變量項以下:
CGI相關變量
變量 | 說明 |
---|---|
REQUEST_METHOD | POST,GET等,HTTP請求的動詞標識 |
SERVER_PROTOCOL | 服務器運行的HTTP協議. 這裏當是HTTP/1.0. |
PATH_INFO | 附加的路徑信息, 由瀏覽器發出. |
QUERY_STRING | 請求URL的「?」後面的部分 |
CONTENT_TYPE | HTTP請求中任何Content-Type字段的內容 |
CONTENT_LENGTH | 標準輸入口的字節數. |
HTTP_[變量] | 其餘一些變量,例如HTTP_ACCEPT,HTTP_REFERER等 |
上述內容是動態開發的根基,只有根據上述內容才能夠標準化的動態處理請求。
WSGI定義變量
變量 | 說明 |
---|---|
wsgi.version | WSGI版本,要求是元組(1,0),標識WSGI 1.0協議 |
wsgi.url_scheme | 表示調用應用程序的URL的協議,http或https |
wsgi.input | 類文件對象,讀取HTTP請求體字節的輸入流 |
wsgi.errors | 類文件對象,寫入錯誤輸出的輸出流 |
wsgi.multithread | 若是是多線程,則設置爲True,不然爲False。 |
wsgi.multiprocess | 若是是多進程,則設置爲True,不然爲False。 |
wsgi.run_once | 若是隻須要運行一次,設置爲True |
WSGI協議對於兩個輸入輸出流有一些方法必需要實現
流 | 方法 |
---|---|
wsgi.input | read(size) |
wsgi.input | readline() |
wsgi.input | readlines(hint) |
wsgi.input | iter() |
wsgi.errors | flush() |
wsgi.errors | write(str) |
wsgi.errors | writelines(seq) |
這些基本上就是WSGI協議中定義的主要變量,也基本上涵蓋了咱們開發時所須要的變量。
Server端按照協議的內容生成這些environ字典,而後將請求信息交給Application,Application根據這些信息確認請求要處理的內容,而後返回響應消息。從頭順下來就是這個流程。
Server端涉及到實現http相關內容,咱們直接使用python內置wsgiref來實現,具體代碼以下:
import time
from wsgiref.simple_server import make_server
class ResponseTimingMiddleware(object):
"""記錄請求耗時"""
def __init__(self, app):
self.app = app
def __call__(self, environ, start_response):
start_time = time.time()
response = self.app(environ, start_response)
response_time = (time.time() - start_time) * 1000
timing_text = "記錄請求耗時中間件輸出\n\n本次請求耗時: {:.10f}ms \n\n\n".format(response_time)
response.append(timing_text.encode('utf-8'))
return response
def simple_app(environ, start_response):
"""Simplest possible application object"""
status = '200 OK'
response_headers = [('Content-type', 'text/plain; charset=utf-8')]
start_response(status, response_headers)
return_body = []
for key, value in environ.items():
return_body.append("{} : {}".format(key, value))
return_body.append("\nHello WSGI!")
# 返回結果必須是bytes
return ["\n".join(return_body).encode("utf-8")]
# 建立應用程序
app = ResponseTimingMiddleware(simple_app)
# 啓動服務,監聽8080
httpd = make_server('localhost', 8080, app)
httpd.serve_forever()
複製代碼
啓動服務後,咱們打開瀏覽器訪問http://localhost:8080,執行結果以下。
上圖能夠看到咱們前面提到的中間件以及Application中執行返回的結果全都實現。
WSGI協議內容就到這,下次咱們閱讀python wsgiref庫的源碼,看其如何實現wsgi協議。