1、什麼是socket編程
socket能夠當作是用戶進程與內核網絡協議棧的編程接口。
socket不只能夠用於本機的進程間通訊,還能夠用於網絡上不一樣主機的進程間通訊。
ubuntu
socket API是一層抽象的網絡編程接口,適用於各類底層網絡協議,如IPv四、IPv6,以及之後要講的UNIX Domain Socket。然而,各類網絡協議的地址格式並不相同,以下圖所示:
小程序
IPv4和IPv6的地址格式定義在netinet/in.h中,IPv4地址用sockaddr_in結構體表示,包括16位端口號和32位IP地址,以下所示:網絡
struct sockaddr_in { uint8_t sin_len; /*length of structure (16)*/ sa_family_t sin_family; /* address family: AF_INET */ in_port_t sin_port; /* port in network byte order */ struct in_addr sin_addr; /* internet address */ char sin_zero[8]; /* pad bytes, set to zero is ok */ };
struct in_addr{ in_addr_t s_addr; /*32-bit IPV4 address*/ };
IPv6地址用sockaddr_in6結構體表示,包括16位端口號、128位IP地址和一些控制字段。UNIX Domain Socket的地址格式定義在sys/un.h中,用sockaddr_un結構體表示。各類socket地址結構體的開頭都是相同的,前16位表示整個結構體的長度(並非全部UNIX的實現都有長度字段,如Linux就沒有),後16位表示地址類型。IPv四、IPv6和UNIX Domain Socket的地址類型分別定義爲常數AF_INET、AF_INET六、AF_UNIX。這樣,只要取得某種sockaddr結構體的首地址,不須要知道具體是哪一種類型的sockaddr結構體,就能夠根據地址類型字段肯定結構體中的內容。所以,socket API能夠接受各類類型的sockaddr結構體指針作參數,例如bind、accept、connect等函數,這些函數的參數應該設計成void *類型以便接受各類類型的指針,可是sock API的實現早於ANSI C標準化,那時尚未void *類型,所以這些函數的參數都用struct sockaddr *類型表示,即通用地址結構,以下所示:socket
struct sockaddr { uint8_t sa_len; sa_family_t sin_family; char sa_data[14]; };
sin_family:指定該地址家族
sa_data:由sin_family決定它的形式。
函數
在傳遞參數以前要強制類型轉換一下,例如:
測試
struct sockaddr_in servaddr;ui
/* initialize servaddr *spa
/bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));
設計
2、網絡字節序
字節序
大端字節序(Big Endian)
最高有效位(MSB:Most Significant Bit)存儲於最低內存地址處,最低有效位(LSB:Lowest Significant Bit)存儲於最高內存地址處。
小端字節序(Little Endian)
最高有效位(MSB:Most Significant Bit)存儲於最高內存地址處,最低有效位(LSB:Lowest Significant Bit)存儲於最低內存地址處。
主機字節序
不一樣的主機有不一樣的字節序,如x86爲小端字節序,Motorola 6800爲大端字節序,ARM字節序是可配置的。
網絡字節序
網絡字節序規定爲大端字節序
爲使網絡程序具備可移植性,使一樣的C代碼在大端和小端計算機上編譯後都能正常運行,能夠調用如下庫函數作網絡字節序和主機字節序的轉換。
#include <arpa/inet.h> uint32_t htonl(uint32_t hostlong); uint16_t htons(uint16_t hostshort); uint32_t ntohl(uint32_t netlong); uint16_t ntohs(uint16_t netshort);
這些函數名很好記,h表示host,n表示network,l表示32位長整數,s表示16位短整數。例如htonl表示將32位的長整數從主機字節序轉換爲網絡字節序,例如將IP地址轉換後準備發送。若是主機是小端字節序,這些函數將參數作相應的大小端轉換而後返回,若是主機是大端字節序,這些函數不作轉換,將參數原封不動地返回。
下面寫個小程序測試下主機的大小端:
#include<stdio.h> #include<arpa/inet.h> int main(void) { unsigned int x = 0x12345678; unsigned char *p = (unsigned char *)&x; printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]); unsigned int y = htonl(x); p = (unsigned char *)&y; printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]); return 0; }
運行結果:
huangcheng@ubuntu:~$ ./a.out 78 56 34 12 12 34 56 78
即本主機是小端字節序,而通過htonl 轉換後爲網絡字節序,即大端。
3、地址轉換函數
前面提到的 sockaddr_in 結構體中的成員struct in_addr sin_addr表示32位的IP地址。可是咱們一般用點分十進制的字符串表示IP地址,如下函數能夠在字符串表示和in_addr表示之間轉換。
字符串轉in_addr的函數:
#include <arpa/inet.h> int inet_aton(const char *strptr, struct in_addr *addrptr); in_addr_t inet_addr(const char *strptr); int inet_pton(int family, const char *strptr, void *addrptr);注意:轉換而成的32位數是網絡字節序的。
char *inet_ntoa(struct in_addr inaddr); const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);注意:傳入的32位數也是網絡字節序的。
下面寫個小程序演示一下:
#include<stdio.h> #include<arpa/inet.h> int main(void) { unsigned int addr = inet_addr("192.168.0.100"); //轉換後是網絡字節序(大端) printf("add=%u\n", ntohl(addr)); struct in_addr ipaddr; ipaddr.s_addr = addr; printf("%s\n", inet_ntoa(ipaddr)); return 0; }運行結果:
huangcheng@ubuntu:~$ ./a.out add=3232235620 192.168.0.100
注意,在打印addr的時候先轉換成主機字節序,不然輸出多是負數。
4、套接字類型
流式套接字(SOCK_STREAM)提供面向鏈接的、可靠的數據傳輸服務,數據無差錯,無重複的發送,且按發送順序接收。數據報式套接字(SOCK_DGRAM)提供無鏈接服務。不提供無錯保證,數據可能丟失或重複,而且接收順序混亂。原始套接字(SOCK_RAW)