網絡上的兩個程序經過一個雙向的通訊鏈接實現數據的交換,這個鏈接的一端稱爲一個socket。html
服務器端和客戶端通訊過程以下所示:
node
服務端的過程主要在該圖的左側部分,下面對上圖的每一步進行詳細的介紹。linux
/* * _domain 套接字使用的協議族信息 * _type 套接字的傳輸類型 * __protocol 通訊協議 * */ int socket (int __domain, int __type, int __protocol) __THROW;
socket起源於UNIX,在Unix一切皆文件哲學的思想下,socket是一種"打開—讀/寫—關閉"模式的實現,能夠將該函數類比經常使用的open()
函數,服務器和客戶端各自維護一個"文件",在創建鏈接打開後,能夠向本身文件寫入內容供對方讀取或者讀取對方內容,通信結束時關閉文件。c++
參數介紹git
第一個參數:關於協議族信息可選字段以下,只列出通常常見的字段。github
地址族 | 含義 |
---|---|
AF_INET | IPv4網絡協議中採用的地址族 |
AF_INET6 | IPv6網絡協議中採用的地址族 |
AF_LOCAL | 本地通訊中採用的UNIX協議的地址族(用的少) |
第二個參數:套接字類型。經常使用的有SOCKET_RAW,SOCK_STREAM和SOCK_DGRAM。算法
套接字類型 | 含義 |
---|---|
SOCKET_RAW | 原始套接字(SOCKET_RAW)容許對較低層次的協議直接訪問,好比IP、 ICMP協議。 |
SOCK_STREAM | SOCK_STREAM是數據流,通常爲TCP/IP協議的編程。 |
SOCK_DGRAM | SOCK_DGRAM是數據報,通常爲UDP協議的網絡編程; |
第三個參數:最終採用的協議。常見的協議有IPPROTO_TCP、IPPTOTO_UDP。若是第二個參數選擇了SOCK_STREAM,那麼採用的協議就只能是IPPROTO_TCP;若是第二個參數選擇的是SOCK_DGRAM,則採用的協議就只能是IPPTOTO_UDP。編程
/* * __fd:socket描述字,也就是socket引用 * myaddr:要綁定給sockfd的協議地址 * __len:地址的長度 */ int bind (int __fd, const struct sockaddr* myaddr, socklen_t __len) __THROW;
第一個參數:socket文件描述符__fd
即套接字建立時返回的對象,ubuntu
第二個參數:myaddr
則是填充了一些網絡地址信息,包含通訊所須要的相關信息,其結構體具體以下:windows
struct sockaddr { sa_family_t sin_family; /* Common data: address family and length. */ char sa_data[14]; /* Address data. */ };
在具體傳參的時候,會用該結構體的變體sockaddr_in
形式去初始化相關字段,該結構體具體形式以下,結構體sockaddr
中的sa_data
就保存着地址信息須要的IP地址和端口號,對應着結構體sockaddr_in
的sin_port
和sin_addr
字段。
struct sockaddr_in{ sa_family_t sin_family; //前面介紹的地址族 uint16_t sin_port; //16位的TCP/UDP端口號 struct in_addr sin_addr; //32位的IP地址 char sin_zero[8]; //不使用 }
in_addr
結構定義以下:
/* Internet address. */ typedef uint32_t in_addr_t; struct in_addr { in_addr_t s_addr; };
而sin_zero
無特殊的含義,只是爲了與下面介紹的sockaddr結構體一致而插入的成員。由於在給套接字分配網絡地址的時候會調用bind
函數,其中的參數會把sockaddr_in
轉化爲sockaddr
的形式,以下:
struct sockaddr_in serv_addr; ... bind(serv_socket, (struct sockaddr*)&serv_addr, sizeof(serv_addr);
須要注意的是s_addr
是一種uint32_t
類型的數據,並且在網絡傳輸時,統一都是以大端序的網絡字節序方式傳輸數據,而咱們一般習慣的IP地址格式是點分十進制,例如:「219.228.148.169」,這個時候就會調用如下函數進行轉化,將IP地址轉化爲32位的整數形數據,同時進行網絡字節轉換:
in_addr_t inet_addr (const char *__cp) __THROW; //或者 int inet_aton (const char *__cp, struct in_addr *__inp) __THROW; //windows無此函數
若是單純要進行網絡字節序地址的轉換,能夠採用以下函數:
/*Functions to convert between host and network byte order. Please note that these functions normally take `unsigned long int' or `unsigned short int' values as arguments and also return them. But this was a short-sighted decision since on different systems the types may have different representations but the values are always the same. */ // h表明主機字節序 // n表明網絡字節序 // s表明short(4字節) // l表明long(8字節) extern uint32_t ntohl (uint32_t __netlong) __THROW __attribute__ ((__const__)); extern uint16_t ntohs (uint16_t __netshort) __THROW __attribute__ ((__const__)); extern uint32_t htonl (uint32_t __hostlong) __THROW __attribute__ ((__const__)); extern uint16_t htons (uint16_t __hostshort)
給套接字分配了所需的信息後,就能夠調用listen()
函數對來自客戶端的鏈接請求進行監聽(客戶端此時要調用connect()
函數進行鏈接)
/* Prepare to accept connections on socket FD. N connection requests will be queued before further requests are refused. Returns 0 on success, -1 for errors. */ extern int listen (int __fd, int __n) __THROW;
第一個參數:socket文件描述符__fd
,分配所需的信息後的套接字。
第二個參數:鏈接請求的隊列長度,若是爲6,表示隊列中最多同時有6個鏈接請求。
這個函數的fd(socket套接字對象)就至關於一個門衛,對鏈接請求作處理,決定是否把鏈接請求放入到server端維護的一個隊列中去。
listen()
中的sock(__fd : socket對象)發揮了服務器端接受請求的門衛做用,此時爲了按序受理請求,給客戶端作相應的回饋,鏈接到發起請求的客戶端,此時就須要再次建立另外一個套接字,該套接字能夠用如下函數建立:
/* Await a connection on socket FD. When a connection arrives, open a new socket to communicate with it, set *ADDR (which is *ADDR_LEN bytes long) to the address of the connecting peer and *ADDR_LEN to the address's actual length, and return the new socket's descriptor, or -1 for errors. This function is a cancellation point and therefore not marked with __THROW. */ extern int accept (int __fd, struct sockaddr *addr, socklen_t *addr_len);
函數成功執行時返回socket文件描述符,失敗時返回-1。
第一個參數:socket文件描述符__fd
,要注意的是這個套接字文件描述符與前面幾步的套接字文件描述符不一樣。
第二個參數:保存發起鏈接的客戶端的地址信息。
第三個參數: 保存該結構體的長度。
linux下的發送函數爲:
/* Write N bytes of BUF to FD. Return the number written, or -1. This function is a cancellation point and therefore not marked with __THROW. */ ssize_t write (int __fd, const void *__buf, size_t __n) ;
而在windows下的發送函數爲:
ssize_t send (int sockfd, const void *buf, size_t nbytes, int flag) ;
第四個參數是傳輸數據時可指定的信息,通常設置爲0。
linux下的接收函數爲
/* Read NBYTES into BUF from FD. Return the number read, -1 for errors or 0 for EOF. This function is a cancellation point and therefore not marked with __THROW. */ ssize_t read (int __fd, void *__buf, size_t __nbytes);
而在windows下的接收函數爲
ssize_t recv(int sockfd, void *buf, size_t nbytes, int flag) ;
/* Close the file descriptor FD. This function is a cancellation point and therefore not marked with __THROW. */ int close (int __fd);
退出鏈接,此時要注意的是:調用close()
函數即表示向對方發送了EOF
結束標誌信息。
服務端的socket套接字在綁定自身的IP即 及端口號後這些信息後,就開始監聽端口等待客戶端的鏈接請求,此時客戶端在建立套接字後就能夠按照以下步驟與server端通訊,建立套接字的過程再也不重複了。
/* Open a connection on socket FD to peer at ADDR (which LEN bytes long). For connectionless socket types, just set the default address to send to and the only address from which to accept transmissions. Return 0 on success, -1 for errors. This function is a cancellation point and therefore not marked with __THROW. */ int connect (int socket, struct sockaddr* servaddr, socklen_t addrlen);
幾個參數的意義和前面的accept函數意義同樣。要注意的是服務器端收到鏈接請求的時候並非立刻調用accept()函數,而是把它放入到請求信息的等待隊列中。
能夠經過以下函數對套接字可選項的參數進行獲取以及設置。
/* Put the current value for socket FD's option OPTNAME at protocol level LEVEL into OPTVAL (which is *OPTLEN bytes long), and set *OPTLEN to the value's actual length. Returns 0 on success, -1 for errors. */ extern int getsockopt (int sock, int __level, int __optname, void *__optval, socklen_t *optlen) __THROW; /* Set socket FD's option OPTNAME at protocol level LEVEL to *OPTVAL (which is OPTLEN bytes long). Returns 0 on success, -1 for errors. */ extern int setsockopt (int sock, int __level, int __optname, const void *__optval, socklen_t __optlen) __THROW;
參數說明:
scok: 套接字的文件描述符
** __level ** :可選項的協議層,以下:
協議層 | 功能 |
---|---|
SOL_SOCKET | 套接字相關通用可選項的設置 |
IPPROTO_IP | 在IP層設置套接字的相關屬性 |
IPPROTO_TCP | 在TCP層設置套接字相關屬性 |
** __optname ** :要查看的可選項名,幾個主要的選項以下
選項名 | 說明 | 數據類型 | 所屬協議層 |
---|---|---|---|
SO_RCVBUF | 接收緩衝區大小 | int | SOL_SOCKET |
SO_SNDBUF | 發送緩衝區大小 | int | SOL_SOCKET |
SO_RCVLOWAT | 接收緩衝區下限 | int | SOL_SOCKET |
SO_SNDLOWAT | 發送緩衝區下限 | int | SOL_SOCKET |
SO_TYPE | 得到套接字類型(這個只能獲取,不能設置) | int | SOL_SOCKET |
SO_REUSEADDR | 是否啓用地址再分配,主要原理是操做關閉套接字的Time-wait時間等待的開啓和關閉 | int | SOL_SOCKET |
IP_HDRINCL | 在數據包中包含IP首部 | int | IPPROTO_IP |
IP_MULTICAST_TTL | 生存時間(Time To Live),組播傳送距離 | int | IPPROTO_IP |
IP_ADD_MEMBERSHIP | 加入組播 | int | IPPROTO_IP |
IP_OPTINOS | IP首部選項 | int | IPPROTO_IP |
TCP_NODELAY | 不使用Nagle算法 | int | IPPROTO_TCP |
TCP_KEEPALIVE | TCP保活機制開啓下,設置保活包空閒發送時間間隔 | int | IPPROTO_TCP |
TCP_KEEPINTVL | TCP保活機制開啓下,設置保活包無響應狀況下重發時間間隔 | int | IPPROTO_TCP |
TCP_KEEPCNT | TCP保活機制開啓下,設置保活包無響應狀況下重複發送次數 | int | IPPROTO_TCP |
TCP_MAXSEG | TCP最大數據段的大小 | int | IPPROTO_TCP |
** __optval ** :保存查看(get)/更改(set)的結果
** optlen ** : 傳遞第四個參數的字節大小
這裏只對幾個可選項參數進行說明:
參考案例以下:
int status, snd_buf; socklen_t len = sizeof(snd_buf); status = getsockopt(serv_socket, SOL_SOCKET, SO_SNDBUF, (void*)&snd_buf, &len); cout << "發送緩衝區大小: " << snd_buf <<endl;
雖然能夠得到的接收/發送緩衝區的大小,可是經過設置接收/發送緩衝區大小時,獲得的結果會與咱們指望的不同,由於對緩衝區大小的設置是一件很謹慎的事,其自身會根據設置的值進行必定的優化。
關於地址再分配問題會發生在這種狀況下,首先看兩種狀況,假設客戶端和服務器正在通信(測試代碼下載地址)。
① 在客戶端的終端按Crtl + c
或者其餘方式斷開與服務器的鏈接,此時客戶端發送FIN消息,通過四次握手斷開鏈接,操做系統關閉套接字,至關於close()
的過程。而後在次啓動客戶端,順利啓動。
② 在服務端的終端按Crtl + c
或者其餘方式斷開與客戶端的鏈接,像①中同樣,再次啓動服務端,此時出現bind() error
錯誤。
服務器端出現這種狀況的緣由是調用套接字分配網絡地址函數bind()
的時候以前使用創建鏈接的同一端口號尚未來得及停用(大約要過兩三分鐘才處於可用狀態),而客戶端申請鏈接的端口是任意指定,程序運行時會動態分配端口號。
服務器端端口沒有被釋放到被釋放的時間狀態稱爲Time-wait狀態,這個狀態的出現能夠藉助TCP斷開鏈接的四次握手協議來分析,以下圖:
當client端發送ACK=1 ack=k+1
這個消息給服務端就當即消除套接字,若此時該消息中途傳輸被遺失,則這個時候server端就永遠沒法收到client的ACK
消息了。
TCP套接字默認是使用Nagle算法的,該算法的特徵是只有收到前一條數據的ACK消息後,纔會發送下一條數據。
從網上找到一張圖說明使用和禁用Nagle算法的區別(圖片來源),以下:
設置代碼以下:
#include <netinet/tcp.h> //注意要引入這個頭文件 int opt_val = 1; setsockopt(serv_socket, IPPROTO_TCP, TCP_NODELAY, (void*)&opt_val, sizeof(opt_val));
案例的過程,在網上看到了關於read和write的發送與接受過程的圖,便於理解:
代碼連接 github
注意以上代碼都是在ubuntu下運行的,在windows的代碼與此有所不一樣。好比要引入一個<winsock2.h>
的頭文件,調用WSAStartup(...)
函數進行Winsock的初始化,並且它們的接受與發送函數也有所不一樣。
《TCP/IP網絡編程》尹聖雨