[Python] 網絡編程之TCP編程

 轉自:TCP編程 - 廖雪峯的官方網站html

 

Socket是網絡編程的一個抽象概念。一般咱們用一個Socket表示「打開了一個網絡連接」,而打開一個Socket須要知道目標計算機的IP地址和端口號,再指定協議類型便可。python

客戶端

大多數鏈接都是可靠的TCP鏈接。建立TCP鏈接時,主動發起鏈接的叫客戶端,被動響應鏈接的叫服務器。編程

舉個例子,當咱們在瀏覽器中訪問新浪時,咱們本身的計算機就是客戶端,瀏覽器會主動向新浪的服務器發起鏈接。若是一切順利,新浪的服務器接受了咱們的鏈接,一個TCP鏈接就創建起來的,後面的通訊就是發送網頁內容了。瀏覽器

因此,咱們要建立一個基於TCP鏈接的Socket,能夠這樣作:服務器

# 導入socket庫:
import socket

# 建立一個socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 創建鏈接:
s.connect(('www.sina.com.cn', 80))

 建立Socket時,AF_INET指定使用IPv4協議,若是要用更先進的IPv6,就指定爲AF_INET6。SOCK_STREAM指定使用面向流的TCP協議,這樣,一個Socket對象就建立成功,可是尚未創建鏈接。網絡

客戶端要主動發起TCP鏈接,必須知道服務器的IP地址和端口號。新浪網站的IP地址能夠用域名www.sina.com.cn自動轉換到IP地址,可是怎麼知道新浪服務器的端口號呢?app

答案是做爲服務器,提供什麼樣的服務,端口號就必須固定下來。因爲咱們想要訪問網頁,所以新浪提供網頁服務的服務器必須把端口號固定在80端口,由於80端口是Web服務的標準端口。其餘服務都有對應的標準端口號,例如SMTP服務是25端口,FTP服務是21端口,等等。端口號小於1024的是Internet標準服務的端口,端口號大於1024的,能夠任意使用。socket

所以,咱們鏈接新浪服務器的代碼以下:tcp

s.connect(('www.sina.com.cn', 80))

 注意參數是一個tuple,包含地址和端口號。ide

 

創建TCP鏈接後,咱們就能夠向新浪服務器發送請求,要求返回首頁的內容:

# 發送數據:
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')

 TCP鏈接建立的是雙向通道,雙方均可以同時給對方發數據。可是誰先發誰後發,怎麼協調,要根據具體的協議來決定。例如,HTTP協議規定客戶端必須先發請求給服務器,服務器收到後才發數據給客戶端。

 

發送的文本格式必須符合HTTP標準,若是格式沒問題,接下來就能夠接收新浪服務器返回的數據了:

# 接收數據:
buffer = []
while True:
    # 每次最多接收1k字節:
    d = s.recv(1024)
    if d:
        buffer.append(d)
    else:
        break
data = b''.join(buffer)

 接收數據時,調用recv(max)方法,一次最多接收指定的字節數,所以,在一個while循環中反覆接收,直到recv()返回空數據,表示接收完畢,退出循環。

 

當咱們接收完數據後,調用close()方法關閉Socket,這樣,一次完整的網絡通訊就結束了:

# 關閉鏈接:
s.close()

 

接收到的數據包括HTTP頭和網頁自己,咱們只須要把HTTP頭和網頁分離一下,把HTTP頭打印出來,網頁內容保存到文件:

header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的數據寫入文件:
with open('sina.html', 'wb') as f:
    f.write(html)

 如今,只須要在瀏覽器中打開這個sina.html文件,就能夠看到新浪的首頁了。

 

服務器

和客戶端編程相比,服務器編程就要複雜一些。

服務器進程首先要綁定一個端口並監聽來自其餘客戶端的鏈接。若是某個客戶端鏈接過來了,服務器就與該客戶端創建Socket鏈接,隨後的通訊就靠這個Socket鏈接了。

因此,服務器會打開固定端口(好比80)監聽,每來一個客戶端鏈接,就建立該Socket鏈接。因爲服務器會有大量來自客戶端的鏈接,因此,服務器要可以區分一個Socket鏈接是和哪一個客戶端綁定的。一個Socket依賴4項:服務器地址、服務器端口、客戶端地址、客戶端端口來惟一肯定一個Socket。

可是服務器還須要同時響應多個客戶端的請求,因此,每一個鏈接都須要一個新的進程或者新的線程來處理,不然,服務器一次就只能服務一個客戶端了。

咱們來編寫一個簡單的服務器程序,它接收客戶端鏈接,把客戶端發過來的字符串加上Hello再發回去。

首先,建立一個基於IPv4和TCP協議的Socket:

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

 

而後,咱們要綁定監聽的地址和端口。服務器可能有多塊網卡,能夠綁定到某一塊網卡的IP地址上,也能夠用0.0.0.0綁定到全部的網絡地址,還能夠用127.0.0.1綁定到本機地址。127.0.0.1是一個特殊的IP地址,表示本機地址,若是綁定到這個地址,客戶端必須同時在本機運行才能鏈接,也就是說,外部的計算機沒法鏈接進來。

端口號須要預先指定。由於咱們寫的這個服務不是標準服務,因此用9999這個端口號。請注意,小於1024的端口號必需要有管理員權限才能綁定:

# 監聽端口:
s.bind(('127.0.0.1', 9999))

 

緊接着,調用listen()方法開始監聽端口,傳入的參數指定等待鏈接的最大數量:

s.listen(5)
print('Waiting for connection...')

 

接下來,服務器程序經過一個永久循環來接受來自客戶端的鏈接,accept()會等待並返回一個客戶端的鏈接:

while True:
    # 接受一個新鏈接:
    sock, addr = s.accept()
    # 建立新線程來處理TCP鏈接:
    t = threading.Thread(target=tcplink, args=(sock, addr))
    t.start()

 

每一個鏈接都必須建立新線程(或進程)來處理,不然,單線程在處理鏈接的過程當中,沒法接受其餘客戶端的鏈接:

def tcplink(sock, addr):
    print('Accept new connection from %s:%s...' % addr)
    sock.send(b'Welcome!')
    while True:
        data = sock.recv(1024)
        time.sleep(1)
        if not data or data.decode('utf-8') == 'exit':
            break
        sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
    sock.close()
    print('Connection from %s:%s closed.' % addr)

 鏈接創建後,服務器首先發一條歡迎消息,而後等待客戶端數據,並加上Hello再發送給客戶端。若是客戶端發送了exit字符串,就直接關閉鏈接。

 

要測試這個服務器程序,咱們還須要編寫一個客戶端程序:

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 創建鏈接:
s.connect(('127.0.0.1', 9999))
# 接收歡迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
    # 發送數據:
    s.send(data)
    print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()

 

咱們須要打開兩個命令行窗口,一個運行服務器程序,另外一個運行客戶端程序,就能夠看到效果了:

須要注意的是,客戶端程序運行完畢就退出了,而服務器程序會永遠運行下去,必須按Ctrl+C退出程序。

 

小結

用TCP協議進行Socket編程在Python中十分簡單,對於客戶端,要主動鏈接服務器的IP和指定端口,對於服務器,要首先監聽指定端口,而後,對每個新的鏈接,建立一個線程或進程來處理。一般,服務器程序會無限運行下去。

同一個端口,被一個Socket綁定了之後,就不能被別的Socket綁定了。

 

完整源碼參考

#!/usr/bin/env python
# coding=utf-8
# Date: 2018-10-11

# 導入socket庫
import socket

# 建立一個socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 創建鏈接
s.connect(("www.sina.com.cn", 80))

# 發送數據
s.send(b"GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n")

# 接收數據
buff = []
while True:
    # 每次最多接收1k字節
    d = s.recv(1024)
    if d:
        buff.append(d)
    else:
        break
data = b"".join(buff)

# 關閉鏈接
s.close()

header, html = data.split(b"\r\n\r\n", 1)
print(header.decode("utf-8"))
# 把接收到的數據寫入文件
with open("sina.html", "wb") as fw:
    fw.write(html)
tcp_client_sina.py

  

#!/usr/bin/env python
# coding=utf-8
# Date: 2018-10-11

import socket
import threading
import time

def tcp_link(sock, addr):
    print("Accept new connection from %s:%s..." % addr)
    sock.send(b"Welcome!")
    while True:
        data = sock.recv(1024)
        time.sleep(1)
        if not data or data.decode("utf-8") == "exit":
            break
        sock.send(("Hello, %s!" % data.decode("utf-8")).encode("utf-8"))
    sock.close()
    print("Connection from %s:%s closed." % addr)

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 監聽端口
s.bind(("127.0.0.1", 9999))

# 指定等待鏈接的最大數量
s.listen(5)
print("Waiting for connection...")

while True:
    # 接收一個新鏈接
    sock, addr = s.accept()
    # 建立新線程來處理TCP鏈接
    t = threading.Thread(target=tcp_link, args=(sock, addr))
    t.start()
tcp_server_local.py

  

#!/usr/bin/env python
# coding=utf-8
# Date: 2018-10-11

# 導入socket庫
import socket

# 建立一個socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 創建鏈接
s.connect(("127.0.0.1", 9999))

# 接收歡迎信息
print(s.recv(1024).decode("utf-8"))

# 發送數據
for data in [b"Michael", b"Tracy", b"Sarah"]:
    s.send(data)
    print(s.recv(1024).decode("utf-8"))
s.send(b"exit")

# 關閉鏈接
s.close()
tcp_client_local.py
相關文章
相關標籤/搜索