Linux下Socket編程

時間 2019-11-21

標籤 linux socket 編程欄目 Linux 简体版

原文原文鏈接

http://blog.chinaunix.net/uid-20733992-id-3450058.htmlhtml

什麼是Socket
　　 Socket接口是TCP/IP網絡的API，Socket接口定義了許多函數或例程，程序員能夠用它們來開發TCP/IP網絡上的應用程序。要學Internet上的TCP/IP網絡編程，必須理解Socket接口。
　　 Socket接口設計者最早是將接口放在Unix操做系統裏面的。若是瞭解Unix系統的輸入和輸出的話，就很容易瞭解Socket了。網絡的 Socket數據傳輸是一種特殊的I/O，Socket也是一種文件描述符。Socket也具備一個相似於打開文件的函數調用Socket()，該函數返回一個整型的Socket描述符，隨後的鏈接創建、數據傳輸等操做都是經過該Socket實現的。經常使用的Socket類型有兩種：流式Socket （SOCK_STREAM）和數據報式Socket（SOCK_DGRAM）。流式是一種面向鏈接的Socket，針對於面向鏈接的TCP服務應用；數據報式Socket是一種無鏈接的Socket，對應於無鏈接的UDP服務應用。編程

Socket創建
　　爲了創建Socket，程序能夠調用Socket函數，該函數返回一個相似於文件描述符的句柄。socket函數原型爲：
　　 int socket(int domain, int type, int protocol);
　　 domain指明所使用的協議族，一般爲PF_INET，表示互聯網協議族（TCP/IP協議族）；type參數指定socket的類型： SOCK_STREAM 或SOCK_DGRAM，Socket接口還定義了原始Socket（SOCK_RAW），容許程序使用低層協議；protocol一般賦值"0"。 Socket()調用返回一個整型socket描述符，你能夠在後面的調用使用它。
　　 Socket描述符是一個指向內部數據結構的指針，它指向描述符表入口。調用Socket函數時，socket執行體將創建一個Socket，實際上"創建一個Socket"意味着爲一個Socket數據結構分配存儲空間。Socket執行體爲你管理描述符表。
　　兩個網絡程序之間的一個網絡鏈接包括五種信息：通訊協議、本地協議地址、本地主機端口、遠端主機地址和遠端協議端口。Socket數據結構中包含這五種信息。數組

Socket配置
　　經過socket調用返回一個socket描述符後，在使用socket進行網絡傳輸之前，必須配置該socket。面向鏈接的socket客戶端經過調用Connect函數在socket數據結構中保存本地和遠端信息。無鏈接socket的客戶端和服務端以及面向鏈接socket的服務端經過調用 bind函數來配置本地信息。
Bind函數將socket與本機上的一個端口相關聯，隨後你就能夠在該端口監聽服務請求。Bind函數原型爲：
　　 int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
　　 Sockfd是調用socket函數返回的socket描述符,my_addr是一個指向包含有本機IP地址及端口號等信息的sockaddr類型的指針；addrlen常被設置爲sizeof(struct sockaddr)。
　　 struct sockaddr結構類型是用來保存socket信息的：
　　 struct sockaddr {
　　 unsigned short sa_family; /* 地址族， AF_xxx */
char sa_data[14]; /* 14 字節的協議地址 */
};
　　 sa_family通常爲AF_INET，表明Internet（TCP/IP）地址族；sa_data則包含該socket的IP地址和端口號。
　　另外還有一種結構類型：
　　 struct sockaddr_in {
　　 short int sin_family; /* 地址族 */
　　 unsigned short int sin_port; /* 端口號 */
　　 struct in_addr sin_addr; /* IP地址 */
　　 unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr一樣大小 */
　　 };
　　這個結構更方便使用。sin_zero用來將sockaddr_in結構填充到與struct sockaddr一樣的長度，能夠用bzero()或memset()函數將其置爲零。指向sockaddr_in 的指針和指向sockaddr的指針能夠相互轉換，這意味着若是一個函數所需參數類型是sockaddr時，你能夠在函數調用的時候將一個指向 sockaddr_in的指針轉換爲指向sockaddr的指針；或者相反。
　　使用bind函數時，能夠用下面的賦值實現自動得到本機IP地址和隨機獲取一個沒有被佔用的端口號：
　　 my_addr.sin_port = 0; /* 系統隨機選擇一個未被使用的端口號 */
　　 my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */
經過將my_addr.sin_port置爲0，函數會自動爲你選擇一個未佔用的端口來使用。一樣，經過將my_addr.sin_addr.s_addr置爲INADDR_ANY，系統會自動填入本機IP地址。
注意在使用bind函數是須要將sin_port和sin_addr轉換成爲網絡字節優先順序；而sin_addr則不須要轉換。
　　計算機數據存儲有兩種字節優先順序：高位字節優先和低位字節優先。Internet上數據以高位字節優先順序在網絡上傳輸，因此對於在內部是以低位字節優先方式存儲數據的機器，在Internet上傳輸數據時就須要進行轉換，不然就會出現數據不一致。
　　下面是幾個字節順序轉換函數：
·htonl()：把32位值從主機字節序轉換成網絡字節序
·htons()：把16位值從主機字節序轉換成網絡字節序
·ntohl()：把32位值從網絡字節序轉換成主機字節序
·ntohs()：把16位值從網絡字節序轉換成主機字節序
　　 Bind()函數在成功被調用時返回0；出現錯誤時返回"-1"並將errno置爲相應的錯誤號。須要注意的是，在調用bind函數時通常不要將端口號置爲小於1024的值，由於1到1024是保留端口號，你能夠選擇大於1024中的任何一個沒有被佔用的端口號。服務器

鏈接創建
　　面向鏈接的客戶程序使用Connect函數來配置socket並與遠端服務器創建一個TCP鏈接，其函數原型爲：
　　 int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);
Sockfd 是socket函數返回的socket描述符；serv_addr是包含遠端主機IP地址和端口號的指針；addrlen是遠端地質結構的長度。 Connect函數在出現錯誤時返回-1，而且設置errno爲相應的錯誤碼。進行客戶端程序設計無須調用bind()，由於這種狀況下只需知道目的機器的IP地址，而客戶經過哪一個端口與服務器創建鏈接並不須要關心，socket執行體爲你的程序自動選擇一個未被佔用的端口，並通知你的程序數據何時到打斷口。
　　 Connect函數啓動和遠端主機的直接鏈接。只有面向鏈接的客戶程序使用socket時才須要將此socket與遠端主機相連。無鏈接協議從不創建直接鏈接。面向鏈接的服務器也從不啓動一個鏈接，它只是被動的在協議端口監聽客戶的請求。
　　 Listen函數使socket處於被動的監聽模式，併爲該socket創建一個輸入數據隊列，將到達的服務請求保存在此隊列中，直到程序處理它們。
　　 int listen(int sockfd， int backlog);
Sockfd 是Socket系統調用返回的socket 描述符；backlog指定在請求隊列中容許的最大請求數，進入的鏈接請求將在隊列中等待accept()它們（參考下文）。Backlog對隊列中等待服務的請求的數目進行了限制，大多數系統缺省值爲20。若是一個服務請求到來時，輸入隊列已滿，該socket將拒絕鏈接請求，客戶將收到一個出錯信息。
當出現錯誤時listen函數返回-1，並置相應的errno錯誤碼。
　　 accept()函數讓服務器接收客戶的鏈接請求。在創建好輸入隊列後，服務器就調用accept函數，而後睡眠並等待客戶的鏈接請求。
　　 int accept(int sockfd, void *addr, int *addrlen);
　　 sockfd是被監聽的socket描述符，addr一般是一個指向sockaddr_in變量的指針，該變量用來存放提出鏈接請求服務的主機的信息（某臺主機從某個端口發出該請求）；addrten一般爲一個指向值爲sizeof(struct sockaddr_in)的整型指針變量。出現錯誤時accept函數返回-1並置相應的errno值。
　　首先，當accept函數監視的 socket收到鏈接請求時，socket執行體將創建一個新的socket，執行體將這個新socket和請求鏈接進程的地址聯繫起來，收到服務請求的初始socket仍能夠繼續在之前的 socket上監聽，同時能夠在新的socket描述符上進行數據傳輸操做。網絡

數據傳輸
　　 Send()和recv()這兩個函數用於面向鏈接的socket上進行數據傳輸。
　　 Send()函數原型爲：
　　 int send(int sockfd, const void *msg, int len, int flags);
Sockfd是你想用來傳輸數據的socket描述符；msg是一個指向要發送數據的指針；Len是以字節爲單位的數據的長度；flags通常狀況下置爲0（關於該參數的用法可參照man手冊）。
　　 Send()函數返回實際上發送出的字節數，可能會少於你但願發送的數據。在程序中應該將send()的返回值與欲發送的字節數進行比較。當send()返回值與len不匹配時，應該對這種狀況進行處理。
char *msg = "Hello!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg,len,0);
……
　　 recv()函數原型爲：
　　 int recv(int sockfd,void *buf,int len,unsigned int flags);
　　 Sockfd是接受數據的socket描述符；buf 是存放接收數據的緩衝區；len是緩衝的長度。Flags也被置爲0。Recv()返回實際上接收的字節數，當出現錯誤時，返回-1並置相應的errno值。
Sendto()和recvfrom()用於在無鏈接的數據報socket方式下進行數據傳輸。因爲本地socket並無與遠端機器創建鏈接，因此在發送數據時應指明目的地址。
sendto()函數原型爲：
　　 int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
　　該函數比send()函數多了兩個參數，to表示目地機的IP地址和端口號信息，而tolen經常被賦值爲sizeof (struct sockaddr)。Sendto 函數也返回實際發送的數據字節長度或在出現發送錯誤時返回-1。
　　 Recvfrom()函數原型爲：
　　 int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
　　 from是一個struct sockaddr類型的變量，該變量保存源機的IP地址及端口號。fromlen常置爲sizeof (struct sockaddr)。當recvfrom()返回時，fromlen包含實際存入from中的數據字節數。Recvfrom()函數返回接收到的字節數或當出現錯誤時返回-1，並置相應的errno。
若是你對數據報socket調用了connect()函數時，你也能夠利用send()和recv()進行數據傳輸，但該socket仍然是數據報socket，而且利用傳輸層的UDP服務。但在發送或接收數據報時，內核會自動爲之加上目地和源地址信息。數據結構

結束傳輸
　　當全部的數據操做結束之後，你能夠調用close()函數來釋放該socket，從而中止在該socket上的任何數據操做：
close(sockfd);
　　你也能夠調用shutdown()函數來關閉該socket。該函數容許你只中止在某個方向上的數據傳輸，而一個方向上的數據傳輸繼續進行。如你能夠關閉某socket的寫操做而容許繼續在該socket上接受數據，直至讀入全部數據。
　　 int shutdown(int sockfd,int how);
　　 Sockfd是須要關閉的socket的描述符。參數 how容許爲shutdown操做選擇如下幾種方式：
　　 ·0-------不容許繼續接收數據
　　 ·1-------不容許繼續發送數據
　　 ·2-------不容許繼續發送和接收數據，
　　 ·均爲容許則調用close ()
　　 shutdown在操做成功時返回0，在出現錯誤時返回-1並置相應errno。併發

Socket編程實例
　　代碼實例中的服務器經過socket鏈接向客戶端發送字符串"Hello, you are connected!"。只要在服務器上運行該服務器軟件，在客戶端運行客戶軟件，客戶端就會收到該字符串。
　　該服務器軟件代碼以下：
#include
#include
#include
#include
#include
#include
#include
#include
#define SERVPORT 3333 /*服務器監聽端口號 */
#define BACKLOG 10 /* 最大同時鏈接請求數 */
main()
{
　 int sockfd,client_fd; /*sock_fd：監聽socket；client_fd：數據傳輸socket */
　 struct sockaddr_in my_addr; /* 本機地址信息 */
　 struct sockaddr_in remote_addr; /* 客戶端地址信息 */
　 if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
　　 perror("socket建立出錯！"); exit(1);
　 }
　 my_addr.sin_family=AF_INET;
　 my_addr.sin_port=htons(SERVPORT);
　 my_addr.sin_addr.s_addr = INADDR_ANY;
　 bzero(&(my_addr.sin_zero),8);
　 if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {
　　 perror("bind出錯！");
　　 exit(1);
　 }
　 if (listen(sockfd, BACKLOG) == -1) {
　　 perror("listen出錯！");
　　 exit(1);
　 }
　 while(1) {
　　 sin_size = sizeof(struct sockaddr_in);
　　 if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr, &sin_size)) == -1) {
　　　 perror("accept出錯");
　　　 continue;
　　}
　　 printf("received a connection from %s ", inet_ntoa(remote_addr.sin_addr));
　　if (!fork()) { /* 子進程代碼段 */
　　　 if (send(client_fd, "Hello, you are connected! ", 26, 0) == -1)
　　　 perror("send出錯！");
　　　close(client_fd);
　　　exit(0);
　　}
　　 close(client_fd);
　　 }
　 }
}
　　服務器的工做流程是這樣的：首先調用socket函數建立一個Socket，而後調用bind函數將其與本機地址以及一個本地端口號綁定，而後調用 listen在相應的socket上監聽，當accpet接收到一個鏈接服務請求時，將生成一個新的socket。服務器顯示該客戶機的IP地址，並經過新的socket向客戶端發送字符串"Hello，you are connected!"。最後關閉該socket。
　　代碼實例中的fork()函數生成一個子進程來處理數據傳輸部分，fork()語句對於子進程返回的值爲0。因此包含fork函數的if語句是子進程代碼部分，它與if語句後面的父進程代碼部分是併發執行的。dom

客戶端程序代碼以下：
#include
#include
#include
#include
#include
#include
#include
#include
#define SERVPORT 3333
#define MAXDATASIZE 100 /*每次最大數據傳輸量 */
main(int argc, char *argv[]){
　 int sockfd, recvbytes;
　 char buf[MAXDATASIZE];
　 struct hostent *host;
　 struct sockaddr_in serv_addr;
　 if (argc < 2) {
fprintf(stderr,"Please enter the server"s hostname! ");
exit(1);
}
　 if((host=gethostbyname(argv[1]))==NULL) {
herror("gethostbyname出錯！");
exit(1);
}
　 if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket建立出錯！");
exit(1);
}
　 serv_addr.sin_family=AF_INET;
　 serv_addr.sin_port=htons(SERVPORT);
　 serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
　 bzero(&(serv_addr.sin_zero),8);
　 if (connect(sockfd, (struct sockaddr *)&serv_addr,
　　 sizeof(struct sockaddr)) == -1) {
perror("connect出錯！");
exit(1);
}
　 if ((recvbytes=recv(sockfd, buf, MAXDATASIZE, 0)) ==-1) {
perror("recv出錯！");
exit(1);
}
　 buf[recvbytes] = "\0";
　 printf("Received: %s",buf);
　 close(sockfd);
}
　　客戶端程序首先經過服務器域名得到服務器的IP地址，而後建立一個socket，調用connect函數與服務器創建鏈接，鏈接成功以後接收從服務器發送過來的數據，最後關閉socket。
　　函數gethostbyname()是完成域名轉換的。因爲IP地址難以記憶和讀寫，因此爲了方便，人們經常用域名來表示主機，這就須要進行域名和IP地址的轉換。函數原型爲：
　　 struct hostent *gethostbyname(const char *name);
　　函數返回爲hosten的結構類型，它的定義以下：
　　 struct hostent {
　 char *h_name; /* 主機的官方域名 */
　　 char **h_aliases; /* 一個以NULL結尾的主機別名數組 */
　　 int h_addrtype; /* 返回的地址類型，在Internet環境下爲AF-INET */
　　 int h_length; /* 地址的字節長度 */
　　 char **h_addr_list; /* 一個以0結尾的數組，包含該主機的全部地址*/
　　 };
　　 #define h_addr h_addr_list[0] /*在h-addr-list中的第一個地址*/
　　當 gethostname()調用成功時，返回指向struct hosten的指針，當調用失敗時返回-1。當調用gethostbyname時，你不能使用perror()函數來輸出錯誤信息，而應該使用herror()函數來輸出。socket

　　無鏈接的客戶/服務器程序的在原理上和鏈接的客戶/服務器是同樣的，二者的區別在於無鏈接的客戶/服務器中的客戶通常不須要創建鏈接，並且在發送接收數據時，須要指定遠端機的地址。

阻塞和非阻塞
　　阻塞函數在完成其指定的任務之前不容許程序調用另外一個函數。例如，程序執行一個讀數據的函數調用時，在此函數完成讀操做之前將不會執行下一程序語句。當服務器運行到accept語句時，而沒有客戶鏈接服務請求到來，服務器就會中止在accept語句上等待鏈接服務請求的到來。這種狀況稱爲阻塞（blocking）。而非阻塞操做則能夠當即完成。好比，若是你但願服務器僅僅注意檢查是否有客戶在等待鏈接，有就接受鏈接，不然就繼續作其餘事情，則能夠經過將Socket設置爲非阻塞方式來實現。非阻塞socket在沒有客戶在等待時就使accept調用當即返回。
　　 #include
　　 #include
　　 ……
sockfd = socket(AF_INET,SOCK_STREAM,0);
fcntl(sockfd,F_SETFL,O_NONBLOCK)；
……
　　經過設置socket爲非阻塞方式，能夠實現"輪詢"若干Socket。當企圖從一個沒有數據等待處理的非阻塞Socket讀入數據時，函數將當即返回，返回值爲-1，並置errno值爲EWOULDBLOCK。可是這種"輪詢"會使CPU處於忙等待方式，從而下降性能，浪費系統資源。而調用 select()會有效地解決這個問題，它容許你把進程自己掛起來，而同時使系統內核監聽所要求的一組文件描述符的任何活動，只要確認在任何被監控的文件描述符上出現活動，select()調用將返回指示該文件描述符已準備好的信息，從而實現了爲進程選出隨機的變化，而沒必要由進程自己對輸入進行測試而浪費 CPU開銷。Select函數原型爲:
int select(int numfds,fd_set *readfds,fd_set *writefds，
fd_set *exceptfds,struct timeval *timeout);
　　其中readfds、writefds、exceptfds分別是被select()監視的讀、寫和異常處理的文件描述符集合。若是你但願肯定是否能夠從標準輸入和某個socket描述符讀取數據，你只須要將標準輸入的文件描述符0和相應的sockdtfd加入到readfds集合中；numfds的值是須要檢查的號碼最高的文件描述符加1，這個例子中numfds的值應爲sockfd+1；當select返回時，readfds將被修改，指示某個文件描述符已經準備被讀取，你能夠經過FD_ISSSET()來測試。爲了實現fd_set中對應的文件描述符的設置、復位和測試，它提供了一組宏：
　　 FD_ZERO(fd_set *set)----清除一個文件描述符集；
　　 FD_SET(int fd,fd_set *set)----將一個文件描述符加入文件描述符集中；
　　 FD_CLR(int fd,fd_set *set)----將一個文件描述符從文件描述符集中清除；
　　 FD_ISSET(int fd,fd_set *set)----試判斷是否文件描述符被置位。
　　 Timeout參數是一個指向struct timeval類型的指針，它可使select()在等待timeout長時間後沒有文件描述符準備好即返回。struct timeval數據結構爲：
　　 struct timeval {
　　 int tv_sec; /* seconds */
　　 int tv_usec; /* microseconds */
};

POP3客戶端實例
　　下面的代碼實例基於POP3的客戶協議，與郵件服務器鏈接並取回指定用戶賬號的郵件。與郵件服務器交互的命令存儲在字符串數組POPMessage中，程序經過一個do-while循環依次發送這些命令。
#include
#include
#include
#include
#include
#include
#include
#include
#define POP3SERVPORT 110
#define MAXDATASIZE 4096

main(int argc, char *argv[]){
int sockfd;
struct hostent *host;
struct sockaddr_in serv_addr;
char *POPMessage[]={
"USER userid ",
"PASS password ",
"STAT ",
"LIST ",
"RETR 1 ",
"DELE 1 ",
"QUIT ",
NULL
};
int iLength;
int iMsg=0;
int iEnd=0;
char buf[MAXDATASIZE];

if((host=gethostbyname("your.server"))==NULL) {
perror("gethostbyname error");
exit(1);
}
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket error");
exit(1);
}
serv_addr.sin_family=AF_INET;
serv_addr.sin_port=htons(POP3SERVPORT);
serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
bzero(&(serv_addr.sin_zero),8);
if (connect(sockfd, (struct sockaddr *)&serv_addr,sizeof(struct sockaddr))==-1){
perror("connect error");
exit(1);
}

do {
send(sockfd,POPMessage[iMsg],strlen(POPMessage[iMsg]),0);
printf("have sent: %s",POPMessage[iMsg]);

iLength=recv(sockfd,buf+iEnd,sizeof(buf)-iEnd,0);
iEnd+=iLength;
buf[iEnd]="\0";
printf("received: %s,%d ",buf,iMsg);

iMsg++;
} while (POPMessage[iMsg]);

close(sockfd);}