[轉]C語言SOCKET編程指南

　　你常常聽到人們談論着「socket」，或許你還不知道它的確切含義。如今讓我告訴你：它是使用標準Unix 文件描述符 (file descriptor)和其它程序通信的方式。什麼？你也許聽到一些Unix高手(hacker)這樣說過：「呀，Unix中的一切就是文件！」那個傢伙也許正在說到一個事實：Unix 程序在執行任何形式的 I/O的時候，程序是在讀或者寫一個文件描述符。一個文件描述符只是一個和打開的文件相關聯的整數。可是(注意後面的話)，這個文件多是一個網絡鏈接，FIFO，管道，終端，磁盤上的文件或者什麼其它的東西。Unix 中全部的東西就是文件！因此，你想和Internet上別的程序通信的時候，你將要使用到文件描述符。你必須理解剛纔的話。如今你腦海中或許冒出這樣的念頭：「那麼我從哪裏獲得網絡通信的文件描述符呢？」，這個問題不管如何我都要回答：你利用系統調用socket()，它返回套接字描述符(socketdescriptor)，而後你再經過它來進行send() 和 recv()調用。「可是...」，你可能有很大的疑惑，「若是它是個文件描述符，那麼爲什麼不用通常調用read()和write()來進行套接字通信？」簡單的答案是：「你可使用！」。詳細的答案是：「你能夠，可是使用send()和recv()讓你更好的控制數據傳輸。」存在這樣一個狀況：在咱們的世界上，有不少種套接字。有DARPA Internet 地址 (Internet 套接字)，本地節點的路徑名 (Unix套接字)，CCITTX.25地址 (你能夠將X.25套接字徹底忽略)。也許在你的Unix 機器上還有其它的。咱們在這裏只講第一種：Internet 套接字。

5、Internet 套接字的兩種類型

　　什麼意思？有兩種類型的Internet套接字？是的。不，我在撒謊。其實還有不少，可是我可不想嚇着你。咱們這裏只講兩種。除了這些, 我打算另外介紹的 "Raw Sockets" 也是很是強大的，很值得查閱。

那麼這兩種類型是什麼呢？一種是"Stream Sockets"（流格式），另一種是"DatagramSockets"（數據包格式）。咱們之後談到它們的時候也會用到"SOCK_STREAM" 和 "SOCK_DGRAM"。數據報套接字有時也叫「無鏈接套接字」(若是你確實要鏈接的時候能夠用connect()。) 流式套接字是可靠的雙向通信的數據流。若是你向套接字按順序輸出「1，2」，那麼它們將按順序「1，2」到達另外一邊。它們是無錯誤的傳遞的，有本身的錯誤控制，在此不討論。

有什麼在使用流式套接字？你可能據說過telnet，不是嗎？它就使用流式套接字。你須要你所輸入的字符按順序到達，不是嗎？一樣，WWW瀏覽器使用的 HTTP 協議也使用它們來下載頁面。實際上，當你經過端口80 telnet 到一個 WWW 站點，而後輸入「GETpagename」的時候，你也能夠獲得 HTML 的內容。爲何流式套接字能夠達到高質量的數據傳輸？這是由於它使用了「傳輸控制協議(The Transmission ControlProtocol)」，也叫「TCP」 (請參考RFC-793得到詳細資料。)TCP控制你的數據按順序到達而且沒有錯

誤。你也許聽到「TCP」是由於聽到過「TCP/IP」。這裏的 IP 是指「Internet 協議」(請參考 RFC-791。)IP 只是處理Internet路由而已。

那麼數據報套接字呢？爲何它叫無鏈接呢？爲何它是不可靠的呢？有這樣的一些事實：若是你發送一個數據報，它可能會到達，它可能次序顛倒了。若是它到達，那麼在這個包的內部是無錯誤的。數據報也使用IP 做路由，可是它不使用TCP。它使用「用戶數據報協議(User DatagramProtocol)」，也叫「UDP」 (請參考RFC-768。)

爲何它們是無鏈接的呢？主要是由於它並不象流式套接字那樣維持一個鏈接。你只要創建一個包，構造一個有目標信息的IP 頭，而後發出去。無需鏈接。它們一般使用於傳輸包-包信息。簡單的應用程序有：tftp, bootp等等。

你也許會想：「假如數據丟失了這些程序如何正常工做？」個人朋友，每一個程序在UDP上有本身的協議。例如，tftp協議每發出的一個被接受到包，收到者必須發回一個包來講「我收到了！」 (一個「命令正確應答」也叫「ACK」包)。若是在必定時間內(例如5秒)，發送方沒有收到應答，它將從新發送，直到獲得 ACK。這一ACK過程在實現SOCK_DGRAM 應用程序的時候很是重要。

6、網絡理論

　　既然我剛纔提到了協議層，那麼如今是討論網絡究竟如何工做和一些關於 SOCK_DGRAM包是如何創建的例子。固然，你也能夠跳過這一段，若是你認爲已經熟悉的話。

如今是學習數據封裝(Data Encapsulation)的時候了！它很是很是重要。它重要性重要到你在網絡課程學（圖1：數據封裝）習中不管如何也得也得掌握它。主要的內容是：一個包，先是被第一個協議(在這裏是TFTP )在它的報頭（也許是報尾）包裝(「封裝」)，而後，整個數據(包括 TFTP頭)被另一個協議 (在這裏是 UDP )封裝，而後下一個(IP )，一直重複下去，直到硬件(物理)層( 這裏是以太網 )。

當另一臺機器接收到包，硬件先剝去以太網頭，內核剝去IP和UDP 頭，TFTP程序再剝去TFTP頭，最後獲得數據。如今咱們終於講到聲名狼藉的網絡分層模型 (Layered NetworkModel)。這種網絡模型在描述網絡系統上相對其它模型有不少優勢。例如，你能夠寫一個套接字程序而不用關心數據的物理傳輸(串行口，以太網，連接單元接口 (AUI) 仍是其它介質)，由於底層的程序會爲你處理它們。實際的網絡硬件和拓撲對於程序員來講是透明的。

不說其它廢話了，我如今列出整個層次模型。若是你要參加網絡考試，可必定要記住：

應用層 (Application)

表示層 (Presentation)

會話層 (Session)

傳輸層(Transport)

網絡層(Network)

數據鏈路層(Data Link)

物理層(Physical)

物理層是硬件(串口，以太網等等)。應用層是和硬件層相隔最遠的--它是用戶和網絡交互的地方。

這個模型如此通用，若是你想，你能夠把它做爲修車指南。把它對應到Unix，結果是：

應用層(Application Layer) (telnet, ftp,等等)

傳輸層(Host-to-Host Transport Layer) (TCP, UDP)

Internet層(Internet Layer) (IP和路由)

網絡訪問層 (Network Access Layer)(網絡層，數據鏈路層和物理層)

如今，你可能看到這些層次如何協調來封裝原始的數據了。

看看創建一個簡單的數據包有多少工做？哎呀，你將不得不使用"cat"來創建數據包頭！這僅僅是個玩笑。對於流式套接字你要做的是 send() 發送數據。對於數據報式套接字，你按照你選擇的方式封裝數據而後使用sendto()。內核將爲你創建傳輸層和 Internet 層，硬件完成網絡訪問層。這就是現代科技。

如今結束咱們的網絡理論速成班。哦，忘記告訴你關於路由的事情了。可是我不許備談它，若是你真的關心，那麼參考 IPRFC。

7、結構體

　　終於談到編程了。在這章，我將談到被套接字用到的各類數據類型。由於它們中的一些內容很重要了。

首先是簡單的一個：socket描述符。它是下面的類型：

int 僅僅是一個常見的 int。

從如今起，事情變得難以想象了，而你所需作的就是繼續看下去。注意這樣的事實：有兩種字節排列順序：重要的字節 (有時叫"octet"，即八位位組) 在前面，或者不重要的字節在前面。前一種叫「網絡字節順序 (Network ByteOrder)」。有些機器在內部是按照這個順序儲存數據，而另外一些則否則。當我說某數據必須按照 NBO 順序，那麼你要調用函數(例如htons() )來將它從本機字節順序 (Host Byte Order) 轉換過來。若是我沒有提到 NBO，那麼就讓它保持本機字節順序。

個人第一個結構(在這個技術手冊TM中)--struct sockaddr。這個結構爲許多類型的套接字儲存套接字地址信息：

structsockaddr

{

unsigned short sa_family;

char sa_data[14];

};

sa_family可以是各類各樣的類型，可是在這篇文章中都是"AF_INET"。 sa_data包含套接字中的目標地址和端口信息。這好像有點不明智。

爲了處理struct sockaddr，程序員創造了一個並列的結構： structsockaddr_in ("in"表明"Internet"。)

struct sockaddr_in

{

short int sin_family;

unsigned short int sin_port;

struct in_addr sin_addr;

unsigned char sin_zero[8];

};

用這個數據結構能夠輕鬆處理套接字地址的基本元素。注意sin_zero(它被加入到這個結構，而且長度和 structsockaddr 同樣)應該使用函數 bzero()或memset() 來所有置零。同時，這一重要的字節，一個指向 sockaddr_in結構體的指針也能夠被指向結構體sockaddr而且代替它。這樣的話即便 socket() 想要的是 struct sockaddr *，你仍然可使用 struct sockaddr_in，而且在最後轉換。同時，注意sin_family 和 struct sockaddr 中的 sa_family 一致並可以設置爲 "AF_INET"。最後，sin_port和 sin_addr 必須是網絡字節順序 (Network Byte Order)！

你也許會反對道："可是，怎麼讓整個數據結構 struct in_addr sin_addr 按照網絡字節順序呢?" 要知道這個問題的答案，咱們就要仔細的看一看這個數據結構：struct in_addr, 有這樣一個聯合(unions)：

struct in_addr

{

unsigned long s_addr;

};

它曾經是個最壞的聯合，可是如今那些日子過去了。若是你聲明"ina" 是數據結構 struct sockaddr_in 的實例，那麼"ina.sin_addr.s_addr" 就儲存4字節的 IP 地址(使用網絡字節順序)。若是你不幸的系統使用的仍是恐怖的聯合 struct in_addr ，你仍是能夠放心4字節的 IP地址而且和上面我說的同樣(這是由於使用了「#define」。)

8、本機轉換

　　咱們如今到了新的章節。咱們曾經講了不少網絡到本機字節順序的轉換，如今能夠實踐了！

你可以轉換兩種類型： short (兩個字節)和 long(四個字節)。這個函數對於變量類型 unsigned也適用。假設你想將 short 從本機字節順序轉換爲網絡字節順序。用 "h" 表示"本機 (host)"，接着是 "to"，而後用 "n" 表示 "網絡 (network)"，最後用 "s" 表示 "short"： h-to-n-s, 或者 htons() ("Host to Network Short")。

太簡單了...

若是不是太傻的話，你必定想到了由"n"，"h"，"s"，和"l"造成的正確組合，例如這裏確定沒有stolh() ("Short toLong Host") 函數，不只在這裏沒有，全部場合都沒有。可是這裏有：

htons()--"Host to Network Short"

htonl()--"Host to Network Long"

ntohs()--"Network to Host Short"

ntohl()--"Network to Host Long"

如今，你可能想你已經知道它們了。你也可能想：「若是我想改變char 的順序要怎麼辦呢?」可是你也許立刻就想到，「用不着考慮的」。你也許會想到：個人68000機器已經使用了網絡字節順序，我沒有必要去調用htonl() 轉換 IP 地址。你多是對的，可是當你移植你的程序到別的機器上的時候，你的程序將失敗。可移植性！這裏是Unix 世界！記住：在你將數據放到網絡上的時候，確信它們是網絡字節順序的。

最後一點：爲何在數據結構 struct sockaddr_in 中， sin_addr 和 sin_port 須要轉換爲網絡字節順序，而sin_family 需不須要呢? 答案是： sin_addr 和sin_port 分別封裝在包的 IP 和 UDP層。所以，它們必需要是網絡字節順序。可是 sin_family 域只是被內核 (kernel) 使用來決定在數據結構中包含什麼類型的地址，因此它必須是本機字節順序。同時，sin_family沒有發送到網絡上，它們能夠是本機字節順序。

9、IP 地址和如何處理它們

如今咱們很幸運，由於咱們有不少的函數來方便地操做IP 地址。沒有必要用手工計算它們，也沒有必要用"<< span>操做來儲存成長整字型。首先，假設你已經有了一個sockaddr_in結構體ina，你有一個IP地址"132.241.5.10"要儲存在其中，你就要用到函數inet_addr(),將IP地址從點數格式轉換成無符號長整型。使用方法以下：

ina.sin_addr.s_addr = inet_addr("132.241.5.10");

注意，inet_addr()返回的地址已是網絡字節格式，因此你無需再調用函數htonl()。

咱們如今發現上面的代碼片段不是十分完整的，由於它沒有錯誤檢查。顯而易見，當inet_addr()發生錯誤時返回-1。記住這些二進制數字？(無符號數)-1僅僅和IP地址255.255.255.255相符合！這但是廣播地址！大錯特錯！記住要先進行錯誤檢查。

好了，如今你能夠將IP地址轉換成長整型了。有沒有其相反的方法呢？它能夠將一個in_addr結構體輸出成點數格式？這樣的話，你就要用到函數inet_ntoa()("ntoa"的含義是"network to ascii")，就像這樣：

printf("%s",inet_ntoa(ina.sin_addr));

它將輸出IP地址。須要注意的是inet_ntoa()將結構體in-addr做爲一個參數，不是長整形。一樣須要注意的是它返回的是一個指向一個字符的指針。它是一個由inet_ntoa()控制的靜態的固定的指針，因此每次調用 inet_ntoa()，它就將覆蓋上次調用時所得的IP地址。例如：

char *a1, *a2;

a1 = inet_ntoa(ina1.sin_addr);

a2 = inet_ntoa(ina2.sin_addr);

printf("address 1: %s/n",a1);

printf("address 2: %s/n",a2);

輸出以下：

address 1:132.241.5.10

address 2:132.241.5.10

假如你須要保存這個IP地址，使用strcopy()函數來指向你本身的字符指針。

上面就是關於這個主題的介紹。稍後，你將學習將一個相似"wintehouse.gov"的字符串轉換成它所對應的IP地址(查閱域名服務,稍後)。

10、socket()函數

我想我不能再不提這個了－下面我將討論一下socket()系統調用。

下面是詳細介紹：

#include

int socket(int domain, int type, intprotocol);

可是它們的參數是什麼? 首先，domain 應該設置成"AF_INET"，就象上面的數據結構struct sockaddr_in 中同樣。而後，參數 type 告訴內核是 SOCK_STREAM 類型仍是 SOCK_DGRAM 類型。最後，把 protocol 設置爲 "0"。(注意：有不少種 domain、type，我不可能一一列出了，請看 socket() 的 man幫助。固然，還有一個"更好"的方式去獲得 protocol。同時請查閱 getprotobyname() 的 man 幫助。)

socket()只是返回你之後在系統調用種可能用到的socket 描述符，或者在錯誤的時候返回-1。全局變量errno中將儲存返回的錯誤值。(請參考perror() 的 man 幫助。)

11、bind()函數

　　一旦你有一個套接字，你可能要將套接字和機器上的必定的端口關聯起來。(若是你想用listen()來偵聽必定端口的數據，這是必要一步--MUD 告訴你說用命令 "telnet x.y.z 6969"。)若是你只想用 connect()，那麼這個步驟沒有必要。可是不管如何，請繼續讀下去。

這裏是系統調用 bind() 的大概：

#include

int bind(intsockfd, struct sockaddr *my_addr, intaddrlen);

sockfd是調用socket 返回的文件描述符。my_addr 是指向數據結構struct sockaddr 的指針，它保存你的地址(即端口和 IP 地址)信息。 addrlen 設置爲sizeof(structsockaddr)。

簡單得很不是嗎? 再看看例子：

#include

#define MYPORT 3490

Void main()

{

int sockfd;

struct sockaddr_in my_addr;

sockfd = socket(AF_INET, SOCK_STREAM,0);

my_addr.sin_family = AF_INET;

my_addr.sin_port = htons(MYPORT);

my_addr.sin_addr.s_addr =inet_addr("132.241.5.10");

bzero(&(my_addr.sin_zero),;

bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr));

}

這裏也有要注意的幾件事情。my_addr.sin_port 是網絡字節順序，my_addr.sin_addr.s_addr也是的。另外要注意到的事情是因系統的不一樣，包含的頭文件也不盡相同，請查閱本地的 man 幫助文件。

在 bind() 主題中最後要說的話是，在處理本身的 IP 地址和/或端口的時候，有些工做是能夠自動處理的。

my_addr.sin_port = 0;

my_addr.sin_addr.s_addr = INADDR_ANY;

經過將0賦給 my_addr.sin_port，你告訴 bind() 本身選擇合適的端口。一樣，將my_addr.sin_addr.s_addr 設置爲 INADDR_ANY，你告訴它自動填上它所運行的機器的 IP 地址。

若是你一貫當心謹慎，那麼你可能注意到我沒有將INADDR_ANY 轉換爲網絡字節順序！這是由於我知道內部的東西：INADDR_ANY 實際上就是 0！即便你改變字節的順序，0依然是0。可是完美主義者說應該到處一致，INADDR_ANY或許是12呢？你的代碼就不能工做了，那麼就看下面的代碼：

my_addr.sin_port = htons(0);

my_addr.sin_addr.s_addr =htonl(INADDR_ANY);

你或許不相信，上面的代碼將能夠隨便移植。我只是想指出，既然你所遇到的程序不會都運行使用htonl的INADDR_ANY。

bind()在錯誤的時候依然是返回-1，而且設置全局錯誤變量errno。

在你調用 bind() 的時候，你要當心的另外一件事情是：不要採用小於 1024的端口號。全部小於1024的端口號都被系統保留！你能夠選擇從1024 到65535的端口(若是它們沒有被別的程序使用的話)。

你要注意的另一件小事是：有時候你根本不須要調用它。若是你使用connect()來和遠程機器進行通信，你不須要關心你的本地端口號(就象你在使用 telnet 的時候)，你只要簡單的調用 connect() 就能夠了，它會檢查套接字是否綁定端口，若是沒有，它會本身綁定一個沒有使用的本地端口。

12、connect()程序

　　如今咱們假設你是個 telnet 程序。你的用戶命令你獲得套接字的文件描述符。你遵從命令調用了socket()。下一步，你的用戶告訴你經過端口 23(標準 telnet 端口)鏈接到"132.241.5.10"。你該怎麼作呢? 幸運的是，你正在閱讀 connect()--如何鏈接到遠程主機這一章。你可不想讓你的用戶失望。

connect()系統調用是這樣的：

#include

int connect(int sockfd, struct sockaddr*serv_addr, int addrlen);

sockfd是系統調用socket() 返回的套接字文件描述符。serv_addr 是保存着目的地端口和 IP 地址的數據結構 struct sockaddr。addrlen 設置爲 sizeof(struct sockaddr)。

想知道得更多嗎？讓咱們來看個例子：

#include

#define DEST_IP"132.241.5.10"

#define DEST_PORT 23

main()

{

int sockfd;

struct sockaddr_in dest_addr;

sockfd = socket(AF_INET, SOCK_STREAM, 0);

dest_addr.sin_family = AF_INET;

dest_addr.sin_port = htons(DEST_PORT);

dest_addr.sin_addr.s_addr =inet_addr(DEST_IP);

bzero(&(dest_addr.sin_zero),;

connect(sockfd, (struct sockaddr*)&dest_addr, sizeof(struct sockaddr));

}

　　再一次，你應該檢查 connect() 的返回值--它在錯誤的時候返回-1，並設置全局錯誤變量 errno。

同時，你可能看到，我沒有調用 bind()。由於我不在意本地的端口號。我只關心我要去那。內核將爲我選擇一個合適的端口號，而咱們所鏈接的地方也自動地得到這些信息。一切都不用擔憂。

13、listen()函數

　　是換換內容得時候了。假如你不但願與遠程的一個地址相連，或者說，僅僅是將它踢開，那你就須要等待接入請求而且用各類方法處理它們。處理過程分兩步：首先，你聽--listen()，而後，你接受--accept() (請看下面的內容)。

除了要一點解釋外，系統調用 listen 也至關簡單。

int listen(intsockfd, int backlog);

sockfd是調用socket() 返回的套接字文件描述符。backlog 是在進入隊列中容許的鏈接數目。什麼意思呢? 進入的鏈接是在隊列中一直等待直到你接受 (accept() 請看下面的文章)鏈接。它們的數目限制於隊列的容許。大多數系統的容許數目是20，你也能夠設置爲5到10。

和別的函數同樣，在發生錯誤的時候返回-1，並設置全局錯誤變量 errno。

你可能想象到了，在你調用 listen() 前你或者要調用 bind() 或者讓內核隨便選擇一個端口。若是你想偵聽進入的鏈接，那麼系統調用的順序可能是這樣的：

socket();

bind();

listen();

由於它至關的明瞭，我將在這裏不給出例子了。(在 accept() 那一章的代碼將更加徹底。)真正麻煩的部分在 accept()。

14、accept()函數

　　準備好了，系統調用 accept() 會有點古怪的地方的！你能夠想象發生這樣的事情：有人從很遠的地方經過一個你在偵聽 (listen()) 的端口鏈接 (connect()) 到你的機器。它的鏈接將加入到等待接受 (accept()) 的隊列中。你調用 accept() 告訴它你有空閒的鏈接。它將返回一個新的套接字文件描述符！這樣你就有兩個套接字了，原來的一個還在偵聽你的那個端口，新的在準備發送 (send()) 和接收 ( recv()) 數據。這就是這個過程！

函數是這樣定義的：

#include

int accept(intsockfd, void *addr, int *addrlen);

sockfd至關簡單，是和listen() 中同樣的套接字描述符。addr 是個指向局部的數據結構 sockaddr_in 的指針。這是要求接入的信息所要去的地方（你能夠測定那個地址在那個端口呼叫你）。在它的地址傳遞給 accept 之前，addrlen 是個局部的整形變量，設置爲 sizeof(struct sockaddr_in)。 accept 將不會將多餘的字節給 addr。若是你放入的少些，那麼它會經過改

變 addrlen 的值反映出來。

一樣，在錯誤時返回-1，並設置全局錯誤變量 errno。

如今是你應該熟悉的代碼片斷。

#include

#define MYPORT 3490

#define BACKLOG 10

main()

{

int sockfd, new_fd;

struct sockaddr_in my_addr;

struct sockaddr_in their_addr;

int sin_size;

sockfd = socket(AF_INET, SOCK_STREAM, 0);

my_addr.sin_family = AF_INET;

my_addr.sin_port = htons(MYPORT);

my_addr.sin_addr.s_addr = INADDR_ANY;

bzero(&(my_addr.sin_zero),;

bind(sockfd, (struct sockaddr*)&my_addr, sizeof(structsockaddr));

listen(sockfd,BACKLOG);

sin_size = sizeof(structsockaddr_in);

new_fd = accept(sockfd,&their_addr,&sin_size);

}

注意，在系統調用 send() 和 recv() 中你應該使用新的套接字描述符 new_fd。若是你只想讓一個鏈接進來，那麼你可使用 close() 去關閉原來的文件描述符 sockfd 來避免同一個端口更多的鏈接。

15、send() and recv()函數

　　這兩個函數用於流式套接字或者數據報套接字的通信。若是你喜歡使用無鏈接的數據報套接字，你應該看一看下面關於sendto() 和recvfrom() 的章節。

send()是這樣的：

int send(intsockfd, const void *msg, int len, intflags);

sockfd是你想發送數據的套接字描述符(或者是調用 socket() 或者是accept() 返回的。)msg 是指向你想發送的數據的指針。len 是數據的長度。把 flags 設置爲 0 就能夠了。(詳細的資料請看send() 的 manpage)。

這裏是一些可能的例子：

char *msg = "Beej washere!";

int len, bytes_sent;

len = strlen(msg);

bytes_sent = send(sockfd, msg, len,0);

send()返回實際發送的數據的字節數--它可能小於你要求發送的數目！注意，有時候你告訴它要發送一堆數據但是它不能處理成功。它只是發送它可能發送的數據，而後但願你可以發送其它的數據。記住，若是send() 返回的數據和len不匹配，你就應該發送其它的數據。可是這裏也有個好消息：若是你要發送的包很小(小於大約 1K)，它可能處理讓數據一次發送完。最後要說得就是，它在錯誤的時候返回-1，並設置 errno。

recv()函數很類似：

int recv(intsockfd, void *buf, int len, unsigned int flags);

sockfd是要讀的套接字描述符。buf 是要讀的信息的緩衝。len 是緩衝的最大長度。flags 能夠設置爲0。(請參考recv() 的 manpage。) recv()返回實際讀入緩衝的數據的字節數。或者在錯誤的時候返回-1，同時設置 errno。

很簡單，不是嗎? 你如今能夠在流式套接字上發送數據和接收數據了。你如今是 Unix 網絡程序員了！

16、sendto() 和 recvfrom()函數

　　「這很不錯啊」，你說，「可是你尚未講無鏈接數據報套接字呢？」沒問題，如今咱們開始這個內容。

既然數據報套接字不是鏈接到遠程主機的，那麼在咱們發送一個包以前須要什麼信息呢?不錯，是目標地址！看看下面的：

int sendto(intsockfd, const void *msg, int len, unsigned intflags,

const struct sockaddr *to, inttolen);

你已經看到了，除了另外的兩個信息外，其他的和函數send() 是同樣的。to 是個指向數據結構 struct sockaddr 的指針，它包含了目的地的IP 地址和端口信息。tolen 能夠簡單地設置爲 sizeof(struct sockaddr)。和函數 send() 相似，sendto() 返回實際發送的字節數(它也可能小於你想要發送的字節數！)，或者在錯誤的時候返回 -1。

類似的還有函數 recv() 和 recvfrom()。recvfrom() 的定義是這樣的：

int recvfrom(int sockfd, void *buf, int len,unsigned int flags,struct sockaddr *from, int *fromlen);

又一次，除了兩個增長的參數外，這個函數和 recv() 也是同樣的。from 是一個指向局部數據結構 struct sockaddr 的指針，它的內容是源機器的 IP 地址和端口信息。fromlen 是個 int 型的局部指針，它的初始值爲 sizeof(struct sockaddr)。函數調用返回後，fromlen 保存着實際儲存在 from 中的地址的長度。

recvfrom()返回收到的字節長度，或者在發生錯誤後返回 -1。

記住，若是你用 connect() 鏈接一個數據報套接字，你能夠簡單的調用 send() 和 recv() 來知足你的要求。這個時候依然是數據報套接字，依然使用UDP，系統套接字接口會爲你自動加上了目標和源的信息。

17、close()和shutdown()函數

　　你已經成天都在發送 (send()) 和接收 (recv()) 數據了，如今你準備關閉你的套接字描述符了。這很簡單，你可使用通常的Unix 文件描述符的 close() 函數：

close(sockfd);

它將防止套接字上更多的數據的讀寫。任何在另外一端讀寫套接字的企圖都將返回錯誤信息。

若是你想在如何關閉套接字上有多一點的控制，你可使用函數shutdown()。它容許你將必定方向上的通信或者雙向的通信(就象close()一樣)關閉，你可使用：

int shutdown(intsockfd, int how);

sockfd是你想要關閉的套接字文件描述復。how 的值是下面的其中之一：

0 - 不容許接受

1 - 不容許發送

2 - 不容許發送和接受(和close()同樣)

shutdown()成功時返回 0，失敗時返回 -1(同時設置 errno。)若是在無鏈接的數據報套接字中使用shutdown()，那麼只不過是讓 send() 和 recv() 不能使用(記住你在數據報套接字中使用了 connect 後是可使用它們的)。

18、getpeername()函數

　　這個函數太簡單了。

它太簡單了，以致我都不想單列一章。可是我仍是這樣作了。函數getpeername()告訴你在鏈接的流式套接字上誰在另一邊。函數是這樣的：

#include

int getpeername(int sockfd, struct sockaddr *addr,int *addrlen);

sockfd是鏈接的流式套接字的描述符。addr 是一個指向結構 struct sockaddr (或者是 struct sockaddr_in) 的指針，它保存着鏈接的另外一邊的信息。addrlen 是一個 int 型的指針，它初始化爲sizeof(struct sockaddr)。函數在錯誤的時候返回 -1，設置相應的 errno。

一旦你得到它們的地址，你可使用 inet_ntoa() 或者 gethostbyaddr()來打印或者得到更多的信息。可是你不能獲得它的賬號。(若是它運行着愚蠢的守護進程，這是可能的，可是它的討論已經超出了本文的範圍，請參考RFC-1413以得到更多的信息。)

19、gethostname()函數

　　甚至比 getpeername() 還簡單的函數是 gethostname()。它返回你程序所運行的機器的主機名字。而後你可使用gethostbyname() 以得到你的機器的 IP 地址。

　　下面是定義：

#include

intgethostname(char *hostname, size_t size);

參數很簡單：hostname 是一個字符數組指針，它將在函數返回時保存

主機名。size是hostname 數組的字節長度。

函數調用成功時返回 0，失敗時返回 -1，並設置errno。

20、域名服務（DNS）

　　若是你不知道 DNS 的意思，那麼我告訴你，它表明域名服務(Domain NameService)。它主要的功能是：你給它一個容易記憶的某站點的地址，它給你 IP 地址(而後你就可使用 bind(), connect(), sendto() 或者其它函數) 。當一我的輸入：

$ telnet whitehouse.gov

telnet能知道它將鏈接(connect()) 到 "198.137.240.100"。

可是這是如何工做的呢? 你能夠調用函數 gethostbyname()：

#include

struct hostent *gethostbyname(const char*name);

很明白的是，它返回一個指向 struct hostent 的指針。這個數據結構是這樣的：

struct hostent

{

char *h_name;

char **h_aliases;

int h_addrtype;

int h_length;

char **h_addr_list;

};

#define h_addrh_addr_list[0]

這裏是這個數據結構的詳細資料：

structhostent:

h_name - 地址的正式名稱。

h_aliases - 空字節-地址的預備名稱的指針。

h_addrtype -地址類型; 一般是AF_INET。

h_length - 地址的比特長度。

h_addr_list - 零字節-主機網絡地址指針。網絡字節順序。

h_addr - h_addr_list中的第一地址。

gethostbyname()成功時返回一個指向結構體 hostent 的指針，或者是個空 (NULL) 指針。(可是和之前不一樣，不設置errno，h_errno 設置錯誤信息。請看下面的 herror()。)

可是如何使用呢? 有時候（咱們能夠從電腦手冊中發現），向讀者灌輸信息是不夠的。這個函數可不象它看上去那麼難用。

這裏是個例子：

#include

int main(int argc, char *argv[])

{

struct hostent *h;

if (argc != 2)

{

fprintf(stderr,"usage: getip address/n");

exit(1);

}

if ((h=gethostbyname(argv[1])) == NULL)

{

herror("gethostbyname");

exit(1);

}

printf("Host name : %s/n",h->h_name);

printf("IP Address : %s/n",inet_ntoa(*((structin_addr *)h->h_addr)));

return 0;

}

在使用 gethostbyname() 的時候，你不能用 perror() 打印錯誤信息 (由於 errno 沒有使用)，你應該調用 herror()。

至關簡單，你只是傳遞一個保存機器名的字符串(例如 "whitehouse.gov") 給 gethostbyname()，而後從返回的數據結構 struct hostent 中獲取信息。

惟一也許讓人不解的是輸出 IP 地址信息。h->h_addr 是一個 char *，可是 inet_ntoa() 須要的是 struct in_addr。所以，我轉換 h->h_addr 成 struct in_addr *，而後獲得數據。

21、客戶-服務器背景知識

　　這裏是個客戶--服務器的世界。在網絡上的全部東西都是在處理客戶進程和服務器進程的交談。舉個telnet的例子。當你用 telnet(客戶)經過23 號端口登錄到主機，主機上運行的一個程序(通常叫 telnetd，服務器)激活。它處理這個鏈接，顯示登錄界面，等等。

圖2：客戶機和服務器的關係

圖 2 說明了客戶和服務器之間的信息交換。

注意，客戶--服務器之間可使用SOCK_STREAM、SOCK_DGRAM 或者其它(只要它們採用相同的)。一些很好的客戶--服務器的例子有telnet/telnetd、 ftp/ftpd 和bootp/bootpd。每次你使用 ftp 的時候，在遠端都有一個 ftpd 爲你服務。

通常，在服務端只有一個服務器，它採用 fork() 來處理多個客戶的鏈接。基本的程序是：服務器等待一個鏈接，接受(accept()) 鏈接，而後 fork() 一個子進程處理它。這是下一章咱們的例子中會講到的。

22、簡單的服務器

　　這個服務器所作的所有工做是在流式鏈接上發送字符串"Hello,World!/n"。你要測試這個程序的話，能夠在一臺機器上運行該程序，而後在另一機器上登錄：

$ telnet remotehostname3490

remotehostname是該程序運行的機器的名字。

服務器代碼：

#include

#define MYPORT 3490

#define BACKLOG 10

main()

{

int sockfd, new_fd;

struct sockaddr_in my_addr;

struct sockaddr_in their_addr;

int sin_size;

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)

{

perror("socket");

exit(1);

}

my_addr.sin_family = AF_INET;

my_addr.sin_port = htons(MYPORT);

my_addr.sin_addr.s_addr =INADDR_ANY;

bzero(&(my_addr.sin_zero),;

if (bind(sockfd, (struct sockaddr*)&my_addr,sizeof(struct sockaddr))== -1)

{

perror("bind");

exit(1);

}

if (listen(sockfd, BACKLOG) == -1)

{

perror("listen");

exit(1);

}

while(1) {

sin_size = sizeof(structsockaddr_in);

if ((new_fd = accept(sockfd,(struct sockaddr *)&their_addr,/

&sin_size)) ==-1)

{

perror("accept");

continue;

}

printf("server: got connectionfrom %s/n", /

inet_ntoa(their_addr.sin_addr));

if (!fork())

{

if (send(new_fd, "Hello, world!/n", 14, 0) ==-1)

perror("send");

close(new_fd);

exit(0);

}

close(new_fd);

while(waitpid(-1,NULL,WNOHANG) >0);

}

若是你很挑剔的話，必定不滿意我全部的代碼都在一個很大的main() 函數中。若是你不喜歡，能夠劃分得更細點。

你也能夠用咱們下一章中的程序獲得服務器端發送的字符串。

23、簡單的客戶程序

　　這個程序比服務器還簡單。這個程序的全部工做是經過3490端口鏈接到命令行中指定的主機，而後獲得服務器發送的字符串。

客戶代碼:

#include

#define PORT 3490

#define MAXDATASIZE 100

int main(int argc, char*argv[])

{

int sockfd,numbytes;

charbuf[MAXDATASIZE];

struct hostent*he;

struct sockaddr_in their_addr;

if (argc != 2)

{

Fprintf(stderr,"usage: clienthostname/n");

exit(1);

}

if ((he=gethostbyname(argv[1])) ==NULL)

{

herror("gethostbyname");

exit(1);

}

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)

{

perror("socket");

exit(1);

}

their_addr.sin_family = AF_INET;

their_addr.sin_port = htons(PORT);

their_addr.sin_addr = *((struct in_addr*)he->h_addr);

bzero(&(their_addr.sin_zero),;

if (connect(sockfd, (struct sockaddr*)&their_addr,sizeof(struct

sockaddr)) == -1)

{

perror("connect");

exit(1);

}

if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0))== -1)

{

perror("recv");

exit(1);

}

buf[numbytes] = '/0';

printf("Received:%s",buf);

close(sockfd);

return 0;

}

注意，若是你在運行服務器以前運行客戶程序，connect() 將返回 "Connection refused" 信息，這很是有用。

24、數據包Sockets

　　我不想講更多了，因此我給出代碼 talker.c 和 listener.c。

listener在機器上等待在端口4590 來的數據包。talker 發送數據包到必定的機器，它包含用戶在命令行輸入的內容。

這裏就是 listener.c：

#include

#define MYPORT 4950

#define MAXBUFLEN 100

Void main()

{

intsockfd;

struct sockaddr_in my_addr;

struct sockaddr_in their_addr;

int addr_len,numbytes;

charbuf[MAXBUFLEN];

if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)

{

perror("socket");

exit(1);

}

my_addr.sin_family = AF_INET;

my_addr.sin_port =htons(MYPORT);

my_addr.sin_addr.s_addr =INADDR_ANY;

bzero(&(my_addr.sin_zero),;

if (bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr))==-1){

perror("bind");

exit(1);

}

addr_len = sizeof(structsockaddr);

if ((numbytes=recvfrom(sockfd,buf, MAXBUFLEN, 0, /

(struct sockaddr*)&their_addr, &addr_len)) ==-1)

{

perror("recvfrom");

exit(1);

}

printf("got packet from%s/n",inet_ntoa(their_addr.sin_addr));

printf("packet is %d byteslong/n",numbytes);

buf[numbytes] ='/0';

printf("packet contains/"%s/"/n",buf);

close(sockfd);

}

注意在咱們的調用 socket()，咱們最後使用了 SOCK_DGRAM。同時，沒有必要去使用 listen() 或者 accept()。咱們在使用無鏈接的數據報套接字！

下面是 talker.c：

#include

#define MYPORT 4950

int main(int argc, char*argv[])

{

intsockfd;

struct sockaddr_in their_addr;

struct hostent*he;

int numbytes;

if (argc != 3)

{

fprintf(stderr,"usage: talker hostnamemessage/n");

exit(1);

}

if ((he=gethostbyname(argv[1])) ==NULL)

{

herror("gethostbyname");

exit(1);

}

if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)

{

perror("socket");

exit(1);

}

their_addr.sin_family = AF_INET;

their_addr.sin_port =htons(MYPORT);

their_addr.sin_addr = *((structin_addr*)he->h_addr);

bzero(&(their_addr.sin_zero),;

if ((numbytes=sendto(sockfd, argv[2],strlen(argv[2]), 0, /

(struct sockaddr*)&their_addr, sizeof(struct sockaddr))) ==-1)

{

perror("sendto");

exit(1);

}

printf("sent %d bytes to %s/n",numbytes,inet_ntoa(their_addr.sin_addr));

close(sockfd);

return 0;

}

這就是全部的了。在一臺機器上運行 listener，而後在另一臺機器上運行 talker。觀察它們的通信！

除了一些我在上面提到的數據套接字鏈接的小細節外，對於數據套接字，我還得說一些，當一個講話者呼叫connect()函數時並指定接受者的地址時，從這點能夠看出，講話者只能向connect()函數指定的地址發送和接受信息。所以，你不須要使用sendto()和recvfrom()，你徹底能夠用send() 和recv()代替。

25、阻塞

　　阻塞，你也許早就據說了。"阻塞"是"sleep"的科技行話。你可能注意到前面運行的 listener 程序，它在那裏不停地運行，等待數據包的到來。實際在運行的是它調用recvfrom()，而後沒有數據，所以recvfrom() 說" 阻塞(block)"，直到數據的到來。

不少函數都利用阻塞。accept() 阻塞，全部的 recv*() 函數阻塞。它們之因此能這樣作是由於它們被容許這樣作。當你第一次調用socket() 創建套接字描述符的時候，內核就將它設置爲阻塞。若是你不想套接字阻塞，你就要調用函數 fcntl()：

#include

sockfd = socket(AF_INET, SOCK_STREAM,0);

fcntl(sockfd, F_SETFL,O_NONBLOCK);

　　經過設置套接字爲非阻塞，你可以有效地"詢問"套接字以得到信息。如果你嘗試着從一個非阻塞的套接字讀信息而且沒有任何數據，它不容許阻塞--它將返回 -1 並將errno 設置爲 EWOULDBLOCK。

可是通常說來，這種詢問不是個好主意。若是你讓你的程序在忙等狀態查詢套接字的數據，你將浪費大量的 CPU時間。更好的解決之道是用下一章講的 select() 去查詢是否有數據要讀進來。

26、select()--多路同步 I/O

　　雖然這個函數有點奇怪，可是它頗有用。假設這樣的狀況：你是個服務器，你一邊在不停地從鏈接上讀數據，一邊在偵聽鏈接上的信息。沒問題，你可能會說，不就是一個 accept() 和兩個 recv() 嗎?這麼容易嗎，朋友? 若是你在調用accept()的時候阻塞呢? 你怎麼可以同時接受recv() 數據? 「用非阻塞的套接字啊！」不行！你不想耗盡全部的CPU 吧? 那麼，該如何是好?

select()讓你能夠同時監視多個套接字。若是你想知道的話，那麼它就會告訴你哪一個套接字準備讀，哪一個又準備寫，哪一個套接字又發生了例外 (exception)。

閒話少說，下面是 select()：

#include

int select(int numfds, fd_set *readfds, fd_set*writefds,fd_set

*exceptfds, struct timeval *timeout);

這個函數監視一系列文件描述符，特別是 readfds、writefds 和exceptfds。若是你想知道你是否可以從標準輸入和套接字描述符 sockfd 讀入數據，你只要將文件描述符 0 和 sockfd 加入到集合readfds 中。參數 numfds 應該等於最高的文件描述符的值加1。在這個例子中，你應該設置該值爲 sockfd+1。由於它必定大於標準輸入的文件描述符 (0)。當函數 select() 返回的時候，readfds 的值修改成反映你選擇的哪一個文件描述符能夠讀。你能夠用下面講到的宏FD_ISSET() 來測試。在咱們繼續下去以前，讓我來說講如何對這些集合進行操做。每一個集合類型都是fd_set。下面有一些宏來對這個類型進行操做：

FD_ZERO(fd_set*set) -清除一個文件描述符集合

FD_SET(int fd,fd_set *set) -添加fd到集合

FD_CLR(int fd,fd_set *set) -從集合中移去fd

FD_ISSET(int fd,fd_set *set) -測試fd是否在集合中

最後，是有點古怪的數據結構 struct timeval。有時你可不想永遠等待別人發送數據過來。也許什麼事情都沒有發生的時候你也想每隔96秒在終端上打印字符串 "Still Going..."。這個數據結構容許你設定一個時間，若是時間到了，而select()尚未找到一個準備好的文件描述符，它將返回讓你繼續處理。

數據結構 struct timeval 是這樣的：

struct timeval

{

int tv_sec;

int tv_usec;

};

只要將 tv_sec 設置爲你要等待的秒數，將 tv_usec 設置爲你要等待的微秒數就能夠了。是的，是微秒而不是毫秒。1,000微秒等於1毫秒，1,000 毫秒等於1秒。也就是說，1秒等於1,000,000微秒。爲何用符號 "usec" 呢?字母 "u" 很象希臘字母Mu，而 Mu 表示 "微"的意思。固然，函數返回的時候 timeout多是剩餘的時間，之因此是可能，是由於它依賴於你的 Unix 操做系統。

哈！咱們如今有一個微秒級的定時器！別計算了，標準的Unix 系統的時間片是100毫秒，因此不管你如何設置你的數據結構 struct timeval，你都要等待那麼長的時間。

還有一些有趣的事情：若是你設置數據結構 struct timeval 中的數據爲 0，select() 將當即超時，這樣就能夠有效地輪詢集合中的全部的文件描述符。若是你將參數timeout 賦值爲 NULL，那麼將永遠不會發生超時，即一直等到第一個文件描述符就緒。最後，若是你不是很關心等待多長時間，那麼就把它賦爲 NULL 吧。

下面的代碼演示了在標準輸入上等待 2.5 秒：

#include

#define STDIN 0

void main()

{

struct timeval tv;

fd_set readfds;

tv.tv_sec = 2;

tv.tv_usec = 500000;

FD_ZERO(&readfds);

FD_SET(STDIN,&readfds);

select(STDIN+1, &readfds, NULL,NULL, &tv);