[轉]C語言SOCKET編程指南


1、介紹html

Socket編程讓你沮喪嗎?從man pages中很可貴到有用的信息嗎?你想跟上時代去編Internet相關的程序,可是爲你在調用 connect() 前的bind() 的結構而不知所措?等等…程序員

好在我已經將這些事完成了,我將和全部人共享個人知識了。若是你瞭解C語言並想穿過網絡編程的沼澤,那麼你來對地方了。web

2、讀者對象編程

這個文檔是一個指南,而不是參考書。若是你剛開始socket編程並想找一本入門書,那麼你是個人讀者。但這不是一本徹底的 socket 編程書。c#

3、平臺和編譯器數組

這篇文檔中的大多數代碼都在 Linux 平臺PC 上用 GNU的 gcc 成功編譯過。並且它們在HPUX平臺 上用 gcc也成功編譯過。可是注意,並非每一個代碼片斷都獨立測試過。瀏覽器

 

 

 

目錄服務器

1、介紹網絡

2、讀者對象數據結構

3、平臺和編譯器

4、什麼是 socket

5、Internet套接字的兩種類型

6、網絡理論

7、結構體

8、本機轉換

9、IP地址和如何處理它們

10、socket()函數

11、bind()函數

12、connect()程序

13、listen()函數

14、accept()函數

15、send() and recv()函數

16、sendto()和recvfrom()函數

17、close()和shutdown()函數

18、getpeername()函數

19、gethostname()函數

20、域名服務(DNS

21、客戶-服務器背景知識

22、簡單的服務器

23、簡單的客戶程序

24、數據包 Sockets

25、阻塞

26、select()--多路同步 I/O

27、參考書目:

28、修改歷史

四、什麼是socket

  你常常聽到人們談論着 「socket」,或許你還不知道它的確切含義。如今讓我告訴你:它是使用標準Unix 文件描述符 (file descriptor)和其它程序通信的方式。什麼?你也許聽到一些Unix高手(hacker)這樣說過:「呀,Unix中的一切就是文件!」那個傢伙也許正在說到一個事實:Unix 程序在執行任何形式的 I/O的時候,程序是在讀或者寫一個文件描述符。一個文件描述符只是一個和打開的文件相關聯的整數。可是(注意後面的話),這個文件多是一個網絡鏈接,FIFO,管道,終端,磁盤上的文件或者什麼其它的東西。Unix 中全部的東西就是文件!因此,你想和Internet上別的程序通信的時候,你將要使用到文件描述符。你必須理解剛纔的話。如今你腦海中或許冒出這樣的念頭:「那麼我從哪裏獲得網絡通信的文件描述符呢?」,這個問題不管如何我都要回答:你利用系統調用socket(),它返回套接字描述符(socketdescriptor),而後你再經過它來進行send() 和 recv()調用。「可是...」,你可能有很大的疑惑,「若是它是個文件描述符,那麼爲什 麼不用通常調用read()和write()來進行套接字通信?」簡單的答案是:「你可使用!」。詳細的答案是:「你能夠,可是使用send()和recv()讓你更好的控制數據傳輸。」存在這樣一個狀況:在咱們的世界上,有不少種套接字。有DARPA Internet 地址 (Internet 套接字),本地節點的路徑名 (Unix套接字),CCITTX.25地址 (你能夠將X.25套接字徹底忽略)。也許在你的Unix 機器上還有其它的。咱們在這裏只講第一種:Internet 套接字。

5Internet 套接字的兩種類型

  什麼意思?有兩種類型的Internet套接字?是的。不,我在撒謊。其實還有不少,可是我可不想嚇着你。咱們這裏只講兩種。除了這些, 我打算另外介紹的 "Raw Sockets" 也是很是強大的,很值得查閱。

那麼這兩種類型是什麼呢?一種是"Stream Sockets"(流格式),另一種是"DatagramSockets"(數據包格式)。咱們之後談到它們的時候也會用到"SOCK_STREAM" 和 "SOCK_DGRAM"。數據報套接字有時也叫「無鏈接套接字」(若是你確實要鏈接的時候能夠用connect()。) 流式套接字是可靠的雙向通信的數據流。若是你向套接字按順序輸出「1,2」,那麼它們將按順序「1,2」到達另外一邊。它們是無錯誤的傳遞的,有本身的錯誤控制,在此不討論。

有什麼在使用流式套接字?你可能據說過telnet,不是嗎?它就使用流式套接字。你須要你所輸入的字符按順序到達,不是嗎?一樣,WWW瀏覽器使用的 HTTP 協議也使用它們來下載頁面。實際上,當你經過端口80 telnet 到一個 WWW 站點,而後輸入 「GETpagename」 的時候,你也能夠獲得 HTML 的內容。爲何流式套接字能夠達到高質量的數據傳輸?這是由於它使用了「傳輸控制協議(The Transmission ControlProtocol)」,也叫 「TCP」 (請參考RFC-793得到詳細資料。)TCP控制你的數據按順序到達而且沒有錯

誤。你也許聽到 「TCP」 是由於聽到過 「TCP/IP」。這裏的 IP 是指「Internet 協議」(請參考 RFC-791。)IP 只是處理Internet路由而已。

那麼數據報套接字呢?爲何它叫無鏈接呢?爲何它是不可靠的呢?有這樣的一些事實:若是你發送一個數據報,它可能會到達,它可能次序顛倒了。若是它到達,那麼在這個包的內部是無錯誤的。數據報也使用IP 做路由,可是它不使用TCP。它使用「用戶數據報協議(User DatagramProtocol)」,也叫 「UDP」 (請參考RFC-768。)

爲何它們是無鏈接的呢?主要是由於它並不象流式套接字那樣維持一個鏈接。你只要創建一個包,構造一個有目標信息的IP 頭,而後發出去。無需鏈接。它們一般使用於傳輸包-包信息。簡單的應用程序有:tftp, bootp等等。

你也許會想:「假如數據丟失了這些程序如何正常工做?」個人朋友,每一個程序在UDP上有本身的協議。例如,tftp協議每發出的一個被接受到包,收到者必須發回一個包來講「我收到了!」 (一個「命令正確應答」也叫「ACK」 包)。若是在必定時間內(例如5秒),發送方沒有收到應答,它將從新發送,直到獲得 ACK。這一ACK過程在實現SOCK_DGRAM 應用程序的時候很是重要。

6、網絡理論

  既然我剛纔提到了協議層,那麼如今是討論網絡究竟如何工做和一些關於 SOCK_DGRAM包是如何創建的例子。固然,你也能夠跳過這一段, 若是你認爲已經熟悉的話。

如今是學習數據封裝(Data Encapsulation)的時候了!它很是很是重要。它重要性重要到你在網絡課程學(圖1:數據封裝)習中不管如何也得也得掌握它。主要 的內容是:一個包,先是被第一個協議(在這裏是TFTP )在它的報頭(也許 是報尾)包裝(「封裝」),而後,整個數據(包括 TFTP頭)被另一個協議 (在這裏是 UDP )封裝,而後下一個(IP ),一直重複下去,直到硬件(物理)層( 這裏是以太網 )。

當另一臺機器接收到包,硬件先剝去以太網頭,內核剝去IP和UDP 頭,TFTP程序再剝去TFTP頭,最後獲得數據。如今咱們終於講到聲名狼藉的網絡分層模型 (Layered NetworkModel)。這種網絡模型在描述網絡系統上相對其它模型有不少優勢。例如,你能夠寫一個套接字程序而不用關心數據的物理傳輸(串行口,以太網,連 接單元接口 (AUI) 仍是其它介質),由於底層的程序會爲你處理它們。實際 的網絡硬件和拓撲對於程序員來講是透明的。

不說其它廢話了,我如今列出整個層次模型。若是你要參加網絡考試,可必定要記住:

應用層 (Application)

表示層 (Presentation)

會話層 (Session)

傳輸層(Transport)

網絡層(Network)

數據鏈路層(Data Link)

物理層(Physical)

物理層是硬件(串口,以太網等等)。應用層是和硬件層相隔最遠的--它 是用戶和網絡交互的地方。

這個模型如此通用,若是你想,你能夠把它做爲修車指南。把它對應 到Unix,結果是:

應用層(Application Layer) (telnet, ftp,等等)

傳輸層(Host-to-Host Transport Layer) (TCP, UDP)

Internet層(Internet Layer) (IP和路由)

網絡訪問層 (Network Access Layer)(網絡層,數據鏈路層和物理層)

如今,你可能看到這些層次如何協調來封裝原始的數據了。

看看創建一個簡單的數據包有多少工做?哎呀,你將不得不使用"cat"來創建數據包頭!這僅僅是個玩笑。對於流式套接字你要做的是 send() 發 送數據。對於數據報式套接字,你按照你選擇的方式封裝數據而後使用sendto()。內核將爲你創建傳輸層和 Internet 層,硬件完成網絡訪問層。這就是現代科技。

如今結束咱們的網絡理論速成班。哦,忘記告訴你關於路由的事情了。可是我不許備談它,若是你真的關心,那麼參考 IPRFC。

7、結構體

  終於談到編程了。在這章,我將談到被套接字用到的各類數據類型。由於它們中的一些內容很重要了。

首先是簡單的一個:socket描述符。它是下面的類型:

int 僅僅是一個常見的 int。

從如今起,事情變得難以想象了,而你所需作的就是繼續看下去。注意這樣的事實:有兩種字節排列順序:重要的字節 (有時叫"octet",即八 位位組) 在前面,或者不重要的字節在前面。前一種叫「網絡字節順序 (Network ByteOrder)」。有些機器在內部是按照這個順序儲存數據,而另外 一些則否則。當我說某數據必須按照 NBO 順序,那麼你要調用函數(例如htons() )來將它從本機字節順序 (Host Byte Order) 轉換過來。若是我沒有 提到 NBO, 那麼就讓它保持本機字節順序。 

個人第一個結構(在這個技術手冊TM中)--struct sockaddr。這個結構 爲許多類型的套接字儲存套接字地址信息:

structsockaddr

unsigned short sa_family;

char sa_data[14];  

}; 

sa_family可以是各類各樣的類型,可是在這篇文章中都是"AF_INET"。 sa_data包含套接字中的目標地址和端口信息。這好像有點不明智。

爲了處理struct sockaddr,程序員創造了一個並列的結構: structsockaddr_in ("in"表明"Internet"。)

struct sockaddr_in

short int sin_family; 

unsigned short int sin_port; 

struct in_addr sin_addr; 

unsigned char sin_zero[8]; 

}; 

用這個數據結構能夠輕鬆處理套接字地址的基本元素。注意sin_zero(它被加入到這個結構,而且長度和 structsockaddr 同樣)應該使用函數 bzero()或memset() 來所有置零。同時,這一重要的字節,一個指向 sockaddr_in結構體的指針也能夠被指向結構體sockaddr而且代替它。這 樣的話即便 socket() 想要的是 struct sockaddr *,你仍然可使用 struct sockaddr_in,而且在最後轉換。同時,注意sin_family 和 struct sockaddr 中的 sa_family 一致並可以設置爲 "AF_INET"。最後,sin_port和 sin_addr 必須是網絡字節順序 (Network Byte Order)!

你也許會反對道:"可是,怎麼讓整個數據結構 struct in_addr sin_addr 按照網絡字節順序呢?" 要知道這個問題的答案,咱們就要仔細的看一看這 個數據結構:struct in_addr, 有這樣一個聯合(unions):

 

struct in_addr

unsigned long s_addr; 

}; 

 

它曾經是個最壞的聯合,可是如今那些日子過去了。若是你聲明"ina" 是數據結構 struct sockaddr_in 的實例,那麼"ina.sin_addr.s_addr" 就儲存4字節的 IP 地址(使用網絡字節順序)。若是你不幸的系統使用的仍是恐 怖的聯合 struct in_addr ,你仍是能夠放心4字節的 IP地址而且和上面 我說的同樣(這是由於使用了「#define」。

 

8、本機轉換

  咱們如今到了新的章節。咱們曾經講了不少網絡到本機字節順序的轉換,如今能夠實踐了!

你可以轉換兩種類型: short (兩個字節)和 long(四個字節)。這個函數對於變量類型 unsigned也適用。假設你想將 short 從本機字節順序轉換爲網絡字節順序。用 "h" 表示"本機 (host)",接着是 "to",而後用 "n" 表 示 "網絡 (network)",最後用 "s" 表示 "short": h-to-n-s, 或者 htons() ("Host to Network Short")。

太簡單了... 

若是不是太傻的話,你必定想到了由"n","h","s",和"l"造成的正確組合,例如這裏確定沒有stolh() ("Short toLong Host") 函數,不只在這裏 沒有,全部場合都沒有。可是這裏有:

htons()--"Host to Network Short"

htonl()--"Host to Network Long"

ntohs()--"Network to Host Short"

ntohl()--"Network to Host Long"

如今,你可能想你已經知道它們了。你也可能想:「若是我想改變char 的順序要怎麼辦呢?」 可是你也許立刻就想到,「用不着考慮的」。你也許 會想到:個人68000機器已經使用了網絡字節順序,我沒有必要去調用htonl() 轉換 IP 地址。你多是對的,可是當你移植你的程序到別的機器 上的時候,你的程序將失敗。可移植性!這裏是Unix 世界!記住:在你將數據放到網絡上的時候,確信它們是網絡字節順序的。

最後一點:爲何在數據結構 struct sockaddr_in 中, sin_addr 和 sin_port 須要轉換爲網絡字節順序,而sin_family 需不須要呢? 答案是: sin_addr 和sin_port 分別封裝在包的 IP 和 UDP層。所以,它們必需要 是網絡字節順序。可是 sin_family 域只是被內核 (kernel) 使用來決定在數據結構中包含什麼類型的地址,因此它必須是本機字節順序。同時,sin_family沒有發送到網絡上,它們能夠是本機字節順序。

9IP 地址和如何處理它們

如今咱們很幸運,由於咱們有不少的函數來方便地操做IP 地址。沒有必要用手工計算它們,也沒有必要用"<< span>操做來儲存成長整字型。首先,假設你已經有了一個sockaddr_in結構體ina,你有一個IP地 址"132.241.5.10"要儲存在其中,你就要用到函數inet_addr(),將IP地址從 點數格式轉換成無符號長整型。使用方法以下:

ina.sin_addr.s_addr = inet_addr("132.241.5.10");

注意,inet_addr()返回的地址已是網絡字節格式,因此你無需再調用 函數htonl()。

咱們如今發現上面的代碼片段不是十分完整的,由於它沒有錯誤檢查。顯而易見,當inet_addr()發生錯誤時返回-1。記住這些二進制數字?(無符 號數)-1僅僅和IP地址255.255.255.255相符合!這但是廣播地址!大錯特錯!記住要先進行錯誤檢查。

好了,如今你能夠將IP地址轉換成長整型了。有沒有其相反的方法呢? 它能夠將一個in_addr結構體輸出成點數格式?這樣的話,你就要用到函數inet_ntoa()("ntoa"的含義是"network to ascii"),就像這樣:

printf("%s",inet_ntoa(ina.sin_addr));

它將輸出IP地址。須要注意的是inet_ntoa()將結構體in-addr做爲一 個參數,不是長整形。一樣須要注意的是它返回的是一個指向一個字符的指針。它是一個由inet_ntoa()控制的靜態的固定的指針,因此每次調用 inet_ntoa(),它就將覆蓋上次調用時所得的IP地址。例如:

char *a1, *a2;

a1 = inet_ntoa(ina1.sin_addr);

a2 = inet_ntoa(ina2.sin_addr);

printf("address 1: %s/n",a1);

printf("address 2: %s/n",a2);

 

輸出以下:

 

address 1:132.241.5.10

address 2:132.241.5.10

假如你須要保存這個IP地址,使用strcopy()函數來指向你本身的字符 指針。

上面就是關於這個主題的介紹。稍後,你將學習將一個相似"wintehouse.gov"的字符串轉換成它所對應的IP地址(查閱域名服務,稍後)。

 

10socket()函數

我想我不能再不提這個了-下面我將討論一下socket()系統調用。

下面是詳細介紹:

#include 

#include 

int socket(int domain, int type, intprotocol); 

可是它們的參數是什麼? 首先,domain 應該設置成"AF_INET",就 象上面的數據結構struct sockaddr_in 中同樣。而後,參數 type 告訴內核 是 SOCK_STREAM 類型仍是 SOCK_DGRAM 類型。最後,把 protocol 設置爲 "0"。(注意:有不少種 domain、type,我不可能一一列出了,請看 socket() 的 man幫助。固然,還有一個"更好"的方式去獲得 protocol。同 時請查閱 getprotobyname() 的 man 幫助。

socket()只是返回你之後在系統調用種可能用到的socket 描述符,或者在錯誤的時候返回-1。全局變量errno中將儲存返回的錯誤值。(請參考perror() 的 man 幫助。

 

11bind()函數

  一旦你有一個套接字,你可能要將套接字和機器上的必定的端口關聯起來。(若是你想用listen()來偵聽必定端口的數據,這是必要一步--MUD 告 訴你說用命令 "telnet x.y.z 6969"。)若是你只想用 connect(),那麼這個步 驟沒有必要。可是不管如何,請繼續讀下去。

這裏是系統調用 bind() 的大概:

#include

#include

int bind(intsockfd, struct sockaddr *my_addr, intaddrlen); 

sockfd是調用socket 返回的文件描述符。my_addr 是指向數據結構struct sockaddr 的指針,它保存你的地址(即端口和 IP 地址)信息。 addrlen 設置爲sizeof(structsockaddr)。

簡單得很不是嗎? 再看看例子:

#include

#include

#include

#define MYPORT 3490 

Void  main()

{

int sockfd;

struct sockaddr_in my_addr;

sockfd = socket(AF_INET, SOCK_STREAM,0);

my_addr.sin_family = AF_INET; 

my_addr.sin_port = htons(MYPORT); 

my_addr.sin_addr.s_addr =inet_addr("132.241.5.10"); 

bzero(&(my_addr.sin_zero),; 

 

bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr));

}

這裏也有要注意的幾件事情。my_addr.sin_port 是網絡字節順序,my_addr.sin_addr.s_addr也是的。另外要注意到的事情是因系統的不一樣, 包含的頭文件也不盡相同,請查閱本地的 man 幫助文件。

在 bind() 主題中最後要說的話是,在處理本身的 IP 地址和/或端口的 時候,有些工做是能夠自動處理的。

 

my_addr.sin_port = 0; 

my_addr.sin_addr.s_addr = INADDR_ANY; 

 

經過將0賦給 my_addr.sin_port,你告訴 bind() 本身選擇合適的端 口。一樣,將my_addr.sin_addr.s_addr 設置爲 INADDR_ANY,你告訴 它自動填上它所運行的機器的 IP 地址。

若是你一貫當心謹慎,那麼你可能注意到我沒有將INADDR_ANY 轉換爲網絡字節順序!這是由於我知道內部的東西:INADDR_ANY 實際上就 是 0!即便你改變字節的順序,0依然是0。可是完美主義者說應該到處一 致,INADDR_ANY或許是12呢?你的代碼就不能工做了,那麼就看下面 的代碼:

my_addr.sin_port = htons(0); 

my_addr.sin_addr.s_addr =htonl(INADDR_ANY); 

你或許不相信,上面的代碼將能夠隨便移植。我只是想指出,既然你所遇到的程序不會都運行使用htonl的INADDR_ANY。

bind()在錯誤的時候依然是返回-1,而且設置全局錯誤變量errno。

在你調用 bind() 的時候,你要當心的另外一件事情是:不要採用小於 1024的端口號。全部小於1024的端口號都被系統保留!你能夠選擇從1024 到65535的端口(若是它們沒有被別的程序使用的話)。

你要注意的另一件小事是:有時候你根本不須要調用它。若是你使 用connect()來和遠程機器進行通信,你不須要關心你的本地端口號(就象 你在使用 telnet 的時候),你只要簡單的調用 connect() 就能夠了,它會檢查套接字是否綁定端口,若是沒有,它會本身綁定一個沒有使用的本地端口。

 

12connect()程序

  如今咱們假設你是個 telnet 程序。你的用戶命令你獲得套接字的文件描述符。你遵從命令調用了socket()。下一步,你的用戶告訴你經過端口 23(標準 telnet 端口)鏈接到"132.241.5.10"。你該怎麼作呢? 幸運的是,你正在閱讀 connect()--如何鏈接到遠程主機這一章。你可 不想讓你的用戶失望。

connect()系統調用是這樣的:

#include 

#include

int connect(int sockfd, struct sockaddr*serv_addr, int addrlen); 

 

sockfd是系統調用socket() 返回的套接字文件描述符。serv_addr 是 保存着目的地端口和 IP 地址的數據結構 struct sockaddr。addrlen 設置 爲 sizeof(struct sockaddr)。

想知道得更多嗎?讓咱們來看個例子:

#include 

#include 

#include 

#define DEST_IP"132.241.5.10" 

#define DEST_PORT 23 

main() 

int sockfd; 

struct sockaddr_in dest_addr; 

sockfd = socket(AF_INET, SOCK_STREAM, 0); 

dest_addr.sin_family = AF_INET; 

dest_addr.sin_port = htons(DEST_PORT); 

dest_addr.sin_addr.s_addr =inet_addr(DEST_IP); 

bzero(&(dest_addr.sin_zero),; 

 

connect(sockfd, (struct sockaddr*)&dest_addr, sizeof(struct sockaddr));

  再一次,你應該檢查 connect() 的返回值--它在錯誤的時候返回-1,並 設置全局錯誤變量 errno。

同時,你可能看到,我沒有調用 bind()。由於我不在意本地的端口號。我只關心我要去那。內核將爲我選擇一個合適的端口號,而咱們所鏈接的 地方也自動地得到這些信息。一切都不用擔憂。

 

13listen()函數

  是換換內容得時候了。假如你不但願與遠程的一個地址相連,或者說,僅僅是將它踢開,那你就須要等待接入請求而且用各類方法處理它們。處 理過程分兩步:首先,你聽--listen(),而後,你接受--accept() (請看下面的 內容)。

除了要一點解釋外,系統調用 listen 也至關簡單。

int listen(intsockfd, int backlog); 

sockfd是調用socket() 返回的套接字文件描述符。backlog 是在進入 隊列中容許的鏈接數目。什麼意思呢? 進入的鏈接是在隊列中一直等待直 到你接受 (accept() 請看下面的文章)鏈接。它們的數目限制於隊列的容許。 大多數系統的容許數目是20,你也能夠設置爲5到10。

和別的函數同樣,在發生錯誤的時候返回-1,並設置全局錯誤變量 errno。

你可能想象到了,在你調用 listen() 前你或者要調用 bind() 或者讓內核隨便選擇一個端口。若是你想偵聽進入的鏈接,那麼系統調用的順序可 能是這樣的:

socket(); 

bind(); 

listen(); 

 

由於它至關的明瞭,我將在這裏不給出例子了。(在 accept() 那一章的 代碼將更加徹底。)真正麻煩的部分在 accept()。

14accept()函數

  準備好了,系統調用 accept() 會有點古怪的地方的!你能夠想象發生這樣的事情:有人從很遠的地方經過一個你在偵聽 (listen()) 的端口鏈接 (connect()) 到你的機器。它的鏈接將加入到等待接受 (accept()) 的隊列 中。你調用 accept() 告訴它你有空閒的鏈接。它將返回一個新的套接字文件描述符!這樣你就有兩個套接字了,原來的一個還在偵聽你的那個端口, 新的在準備發送 (send()) 和接收 ( recv()) 數據。這就是這個過程!

函數是這樣定義的:

#include

int accept(intsockfd, void *addr, int *addrlen); 

sockfd至關簡單,是和listen() 中同樣的套接字描述符。addr 是個指 向局部的數據結構 sockaddr_in 的指針。這是要求接入的信息所要去的地方(你能夠測定那個地址在那個端口呼叫你)。在它的地址傳遞給 accept 之 前,addrlen 是個局部的整形變量,設置爲 sizeof(struct sockaddr_in)。 accept 將不會將多餘的字節給 addr。若是你放入的少些,那麼它會經過改

變 addrlen 的值反映出來。

一樣,在錯誤時返回-1,並設置全局錯誤變量 errno。

如今是你應該熟悉的代碼片斷。

#include

#include

#include

#define MYPORT 3490  

#define BACKLOG 10  

main() 

int sockfd, new_fd;  

struct sockaddr_in my_addr; 

struct sockaddr_in their_addr; 

int sin_size; 

sockfd = socket(AF_INET, SOCK_STREAM, 0); 

my_addr.sin_family = AF_INET; 

my_addr.sin_port = htons(MYPORT); 

my_addr.sin_addr.s_addr = INADDR_ANY; 

bzero(&(my_addr.sin_zero),; 

 

bind(sockfd, (struct sockaddr*)&my_addr, sizeof(structsockaddr)); 

listen(sockfd,BACKLOG); 

sin_size = sizeof(structsockaddr_in); 

new_fd = accept(sockfd,&their_addr,&sin_size);

}

注意,在系統調用 send() 和 recv() 中你應該使用新的套接字描述符 new_fd。若是你只想讓一個鏈接進來,那麼你可使用 close() 去關閉原 來的文件描述符 sockfd 來避免同一個端口更多的鏈接。

15send() and recv()函數

  這兩個函數用於流式套接字或者數據報套接字的通信。若是你喜歡使用無鏈接的數據報套接字,你應該看一看下面關於sendto() 和recvfrom() 的章節。

send()是這樣的:

int send(intsockfd, const void *msg, int len, intflags); 

sockfd是你想發送數據的套接字描述符(或者是調用 socket() 或者是accept() 返回的。)msg 是指向你想發送的數據的指針。len 是數據的長度。 把 flags 設置爲 0 就能夠了。(詳細的資料請看send() 的 manpage)。

這裏是一些可能的例子:

char *msg = "Beej washere!"; 

int len, bytes_sent;

len = strlen(msg);

bytes_sent = send(sockfd, msg, len,0);

send()返回實際發送的數據的字節數--它可能小於你要求發送的數 目!注意,有時候你告訴它要發送一堆數據但是它不能處理成功。它只是 發送它可能發送的數據,而後但願你可以發送其它的數據。記住,若是send() 返回的數據和len不匹配,你就應該發送其它的數據。可是這裏也 有個好消息:若是你要發送的包很小(小於大約 1K),它可能處理讓數據一 次發送完。最後要說得就是,它在錯誤的時候返回-1,並設置 errno。

recv()函數很類似:

int recv(intsockfd, void *buf, int len, unsigned int flags);

sockfd是要讀的套接字描述符。buf 是要讀的信息的緩衝。len 是緩 衝的最大長度。flags 能夠設置爲0。(請參考recv() 的 manpage。) recv()返回實際讀入緩衝的數據的字節數。或者在錯誤的時候返回-1, 同時設置 errno。

很簡單,不是嗎? 你如今能夠在流式套接字上發送數據和接收數據了。 你如今是 Unix 網絡程序員了!

16sendto() 和 recvfrom()函數

  「這很不錯啊」,你說,「可是你尚未講無鏈接數據報套接字呢?」沒問題,如今咱們開始這個內容。

既然數據報套接字不是鏈接到遠程主機的,那麼在咱們發送一個包以前須要什麼信息呢?不錯,是目標地址!看看下面的:

int sendto(intsockfd, const void *msg, int len, unsigned intflags, 

const struct sockaddr *to, inttolen); 

你已經看到了,除了另外的兩個信息外,其他的和函數send() 是同樣 的。to 是個指向數據結構 struct sockaddr 的指針,它包含了目的地的IP 地址和端口信息。tolen 能夠簡單地設置爲 sizeof(struct sockaddr)。 和函數 send() 相似,sendto() 返回實際發送的字節數(它也可能小於 你想要發送的字節數!),或者在錯誤的時候返回 -1。

類似的還有函數 recv() 和 recvfrom()。recvfrom() 的定義是這樣的:

int recvfrom(int sockfd, void *buf, int len,unsigned int flags,struct sockaddr *from, int *fromlen);

又一次,除了兩個增長的參數外,這個函數和 recv() 也是同樣的。from 是一個指向局部數據結構 struct sockaddr 的指針,它的內容是源機器的 IP 地址和端口信息。fromlen 是個 int 型的局部指針,它的初始值爲 sizeof(struct sockaddr)。函數調用返回後,fromlen 保存着實際儲存在 from 中的地址的長度。

recvfrom()返回收到的字節長度,或者在發生錯誤後返回 -1。

記住,若是你用 connect() 鏈接一個數據報套接字,你能夠簡單的調 用 send() 和 recv() 來知足你的要求。這個時候依然是數據報套接字,依 然使用UDP,系統套接字接口會爲你自動加上了目標和源的信息。

17close()和shutdown()函數

  你已經成天都在發送 (send()) 和接收 (recv()) 數據了,如今你準備關 閉你的套接字描述符了。這很簡單,你可使用通常的Unix 文件描述符 的 close() 函數:

close(sockfd);

它將防止套接字上更多的數據的讀寫。任何在另外一端讀寫套接字的企圖都將返回錯誤信息。

若是你想在如何關閉套接字上有多一點的控制,你可使用函數shutdown()。它容許你將必定方向上的通信或者雙向的通信(就象close()一 樣)關閉,你可使用:

int shutdown(intsockfd, int how); 

sockfd是你想要關閉的套接字文件描述復。how 的值是下面的其中之 一:

0 - 不容許接受

1 - 不容許發送

2 - 不容許發送和接受(和close()同樣)

shutdown()成功時返回 0,失敗時返回 -1(同時設置 errno。)若是在無鏈接的數據報套接字中使用shutdown(),那麼只不過是讓 send() 和 recv() 不能使用(記住你在數據報套接字中使用了 connect 後 是可使用它們的)。

18getpeername()函數

  這個函數太簡單了。

它太簡單了,以致我都不想單列一章。可是我仍是這樣作了。 函數getpeername()告訴你在鏈接的流式套接字上誰在另一邊。函 數是這樣的:

#include

int getpeername(int sockfd, struct sockaddr *addr,int *addrlen);

sockfd是鏈接的流式套接字的描述符。addr 是一個指向結構 struct sockaddr (或者是 struct sockaddr_in) 的指針,它保存着鏈接的另外一邊的 信息。addrlen 是一個 int 型的指針,它初始化爲sizeof(struct sockaddr)。 函數在錯誤的時候返回 -1,設置相應的 errno。

一旦你得到它們的地址,你可使用 inet_ntoa() 或者 gethostbyaddr()來打印或者得到更多的信息。可是你不能獲得它的賬號。(若是它運行着愚 蠢的守護進程,這是可能的,可是它的討論已經超出了本文的範圍,請參考RFC-1413以得到更多的信息。

19gethostname()函數

  甚至比 getpeername() 還簡單的函數是 gethostname()。它返回你程 序所運行的機器的主機名字。而後你可使用gethostbyname() 以得到你的機器的 IP 地址。

  下面是定義:

#include

intgethostname(char *hostname, size_t size);

參數很簡單:hostname 是一個字符數組指針,它將在函數返回時保存

主機名。size是hostname 數組的字節長度。

函數調用成功時返回 0,失敗時返回 -1,並設置errno。

20、域名服務(DNS)

  若是你不知道 DNS 的意思,那麼我告訴你,它表明域名服務(Domain NameService)。它主要的功能是:你給它一個容易記憶的某站點的地址, 它給你 IP 地址(而後你就可使用 bind(), connect(), sendto() 或者其它 函數) 。當一我的輸入:

$ telnet whitehouse.gov 

telnet能知道它將鏈接(connect()) 到 "198.137.240.100"。

可是這是如何工做的呢? 你能夠調用函數 gethostbyname():

#include

struct hostent *gethostbyname(const char*name); 

很明白的是,它返回一個指向 struct hostent 的指針。這個數據結構 是這樣的:

struct hostent

{

char *h_name;

char **h_aliases;

int h_addrtype;

int h_length;

char **h_addr_list;

};

#define h_addrh_addr_list[0] 

這裏是這個數據結構的詳細資料:

structhostent: 

h_name - 地址的正式名稱。

h_aliases - 空字節-地址的預備名稱的指針。

h_addrtype -地址類型; 一般是AF_INET。

h_length - 地址的比特長度。

h_addr_list - 零字節-主機網絡地址指針。網絡字節順序。

h_addr - h_addr_list中的第一地址。

gethostbyname()成功時返回一個指向結構體 hostent 的指針,或者 是個空 (NULL) 指針。(可是和之前不一樣,不設置errno,h_errno 設置錯 誤信息。請看下面的 herror()。

可是如何使用呢? 有時候(咱們能夠從電腦手冊中發現),向讀者灌輸信息是不夠的。這個函數可不象它看上去那麼難用。

這裏是個例子:

#include

#include

#include

#include

#include

#include

int main(int argc, char *argv[])

{

struct hostent *h;

if (argc != 2)

{

fprintf(stderr,"usage: getip address/n");

exit(1);

}

if ((h=gethostbyname(argv[1])) == NULL)

{

herror("gethostbyname");

exit(1);

}

printf("Host name : %s/n",h->h_name);

printf("IP Address : %s/n",inet_ntoa(*((structin_addr *)h->h_addr)));

return 0;

}

在使用 gethostbyname() 的時候,你不能用 perror() 打印錯誤信息 (由於 errno 沒有使用),你應該調用 herror()。

至關簡單,你只是傳遞一個保存機器名的字符串(例如 "whitehouse.gov") 給 gethostbyname(),而後從返回的數據結構 struct hostent 中獲取信息。

惟一也許讓人不解的是輸出 IP 地址信息。h->h_addr 是一個 char *, 可是 inet_ntoa() 須要的是 struct in_addr。所以,我轉換 h->h_addr 成 struct in_addr *,而後獲得數據。

 

21、客戶-服務器背景知識

  這裏是個客戶--服務器的世界。在網絡上的全部東西都是在處理客戶進程和服務器進程的交談。舉個telnet的例子。當你用 telnet(客戶)經過23 號端口登錄到主機,主機上運行的一個程序(通常叫 telnetd,服務器)激活。 它處理這個鏈接,顯示登錄界面,等等。

 

2:客戶機和服務器的關係

圖 2 說明了客戶和服務器之間的信息交換。

注意,客戶--服務器之間可使用SOCK_STREAM、SOCK_DGRAM 或者其它(只要它們採用相同的)。一些很好的客戶--服務器的例子有telnet/telnetd、 ftp/ftpd 和bootp/bootpd。每次你使用 ftp 的時候,在遠 端都有一個 ftpd 爲你服務。

通常,在服務端只有一個服務器,它採用 fork() 來處理多個客戶的鏈接。基本的程序是:服務器等待一個鏈接,接受(accept()) 鏈接,而後 fork() 一個子進程處理它。這是下一章咱們的例子中會講到的。

 

22、簡單的服務器

  這個服務器所作的所有工做是在流式鏈接上發送字符串"Hello,World!/n"。你要測試這個程序的話,能夠在一臺機器上運行該程序,而後 在另一機器上登錄:

$ telnet remotehostname3490 

remotehostname是該程序運行的機器的名字。

服務器代碼:

#include

#include

#include

#include

#include

#include

#include

#include

#define MYPORT 3490  

#define BACKLOG 10  

main() 

int sockfd, new_fd; 

struct sockaddr_in my_addr; 

struct sockaddr_in their_addr; 

int sin_size;

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)

perror("socket"); 

exit(1); 

}

my_addr.sin_family = AF_INET; 

my_addr.sin_port = htons(MYPORT); 

my_addr.sin_addr.s_addr =INADDR_ANY;  

bzero(&(my_addr.sin_zero),;

if (bind(sockfd, (struct sockaddr*)&my_addr,sizeof(struct sockaddr))== -1)

perror("bind"); 

exit(1); 

if (listen(sockfd, BACKLOG) == -1)

perror("listen"); 

exit(1); 

}

while(1) {  

sin_size = sizeof(structsockaddr_in); 

if ((new_fd = accept(sockfd,(struct sockaddr *)&their_addr,/ 

&sin_size)) ==-1)

perror("accept"); 

continue; 

printf("server: got connectionfrom %s/n", / 

inet_ntoa(their_addr.sin_addr)); 

if (!fork())

{  

if (send(new_fd, "Hello, world!/n", 14, 0) ==-1) 

perror("send"); 

close(new_fd); 

exit(0); 

close(new_fd); 

while(waitpid(-1,NULL,WNOHANG) >0);  

若是你很挑剔的話,必定不滿意我全部的代碼都在一個很大的main() 函數中。若是你不喜歡,能夠劃分得更細點。

你也能夠用咱們下一章中的程序獲得服務器端發送的字符串。

 

23、簡單的客戶程序

  這個程序比服務器還簡單。這個程序的全部工做是經過3490端口鏈接到命令行中指定的主機,而後獲得服務器發送的字符串。

客戶代碼

#include

#include

#include

#include

#include

#include

#include

#include

#define PORT 3490  

#define MAXDATASIZE 100 

int main(int argc, char*argv[]) 

int sockfd,numbytes; 

charbuf[MAXDATASIZE]; 

struct hostent*he; 

struct sockaddr_in their_addr; 

if (argc != 2)

Fprintf(stderr,"usage: clienthostname/n"); 

exit(1); 

if ((he=gethostbyname(argv[1])) ==NULL)

{  

herror("gethostbyname"); 

exit(1); 

}

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)

perror("socket"); 

exit(1); 

}

their_addr.sin_family = AF_INET; 

their_addr.sin_port = htons(PORT); 

their_addr.sin_addr = *((struct in_addr*)he->h_addr); 

bzero(&(their_addr.sin_zero),; 

if (connect(sockfd, (struct sockaddr*)&their_addr,sizeof(struct 

sockaddr)) == -1)

perror("connect"); 

exit(1); 

if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0))== -1)

perror("recv"); 

exit(1); 

buf[numbytes] = '/0'; 

printf("Received:%s",buf); 

close(sockfd);  

return 0; 

注意,若是你在運行服務器以前運行客戶程序,connect() 將返回 "Connection refused" 信息,這很是有用。

 

24、數據包Sockets

  我不想講更多了,因此我給出代碼 talker.c 和 listener.c。

listener在機器上等待在端口4590 來的數據包。talker 發送數據包到必定的機器,它包含用戶在命令行輸入的內容。

這裏就是 listener.c:

#include

#include

#include

#include

#include

#include

#include

#include

#define MYPORT 4950  

#define MAXBUFLEN 100 

Void main() 

intsockfd; 

struct sockaddr_in my_addr; 

struct sockaddr_in their_addr; 

int addr_len,numbytes; 

charbuf[MAXBUFLEN]; 

if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)

perror("socket"); 

exit(1); 

my_addr.sin_family = AF_INET; 

my_addr.sin_port =htons(MYPORT);  

my_addr.sin_addr.s_addr =INADDR_ANY;  

bzero(&(my_addr.sin_zero),; 

if (bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr))==-1){ 

perror("bind"); 

exit(1); 

}

addr_len = sizeof(structsockaddr); 

if ((numbytes=recvfrom(sockfd,buf, MAXBUFLEN, 0, / 

(struct sockaddr*)&their_addr, &addr_len)) ==-1)

perror("recvfrom"); 

exit(1); 

printf("got packet from%s/n",inet_ntoa(their_addr.sin_addr)); 

printf("packet is %d byteslong/n",numbytes); 

buf[numbytes] ='/0'; 

printf("packet contains/"%s/"/n",buf); 

close(sockfd); 

注意在咱們的調用 socket(),咱們最後使用了 SOCK_DGRAM。同時, 沒有必要去使用 listen() 或者 accept()。咱們在使用無鏈接的數據報套接 字!

下面是 talker.c:

#include

#include

#include

#include

#include

#include

#include

#include

#define MYPORT 4950  

int main(int argc, char*argv[]) 

intsockfd; 

struct sockaddr_in their_addr; 

struct hostent*he; 

int numbytes;

if (argc != 3)

fprintf(stderr,"usage: talker hostnamemessage/n"); 

exit(1); 

}

if ((he=gethostbyname(argv[1])) ==NULL)

{  

herror("gethostbyname"); 

exit(1); 

}

if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)

perror("socket"); 

exit(1); 

}

their_addr.sin_family = AF_INET; 

their_addr.sin_port =htons(MYPORT);  

their_addr.sin_addr = *((structin_addr*)he->h_addr); 

bzero(&(their_addr.sin_zero),; 

if ((numbytes=sendto(sockfd, argv[2],strlen(argv[2]), 0, / 

(struct sockaddr*)&their_addr, sizeof(struct sockaddr))) ==-1)

perror("sendto"); 

exit(1); 

printf("sent %d bytes to %s/n",numbytes,inet_ntoa(their_addr.sin_addr)); 

close(sockfd); 

return 0; 

}  

這就是全部的了。在一臺機器上運行 listener,而後在另一臺機器上 運行 talker。觀察它們的通信!

除了一些我在上面提到的數據套接字鏈接的小細節外,對於數據套接字,我還得說一些,當一個講話者呼叫connect()函數時並指定接受者的地 址時,從這點能夠看出,講話者只能向connect()函數指定的地址發送和接受信息。所以,你不須要使用sendto()和recvfrom(),你徹底能夠用send() 和recv()代替。

 

25、阻塞

  阻塞,你也許早就據說了。"阻塞"是"sleep"的科技行話。你可能注意 到前面運行的 listener 程序,它在那裏不停地運行,等待數據包的到來。 實際在運行的是它調用recvfrom(),而後沒有數據,所以recvfrom() 說" 阻塞(block)",直到數據的到來。

不少函數都利用阻塞。accept() 阻塞,全部的 recv*() 函數阻塞。它 們之因此能這樣作是由於它們被容許這樣作。當你第一次調用socket() 創建套接字描述符的時候,內核就將它設置爲阻塞。若是你不想套接字阻塞, 你就要調用函數 fcntl():

#include

#include

sockfd = socket(AF_INET, SOCK_STREAM,0); 

fcntl(sockfd, F_SETFL,O_NONBLOCK); 

  經過設置套接字爲非阻塞,你可以有效地"詢問"套接字以得到信息。如 果你嘗試着從一個非阻塞的套接字讀信息而且沒有任何數據,它不容許阻塞--它將返回 -1 並將errno 設置爲 EWOULDBLOCK。

可是通常說來,這種詢問不是個好主意。若是你讓你的程序在忙等狀態查詢套接字的數據,你將浪費大量的 CPU時間。更好的解決之道是用 下一章講的 select() 去查詢是否有數據要讀進來。

 

26select()--多路同步 I/O

  雖然這個函數有點奇怪,可是它頗有用。假設這樣的狀況:你是個服務器,你一邊在不停地從鏈接上讀數據,一邊在偵聽鏈接上的信息。 沒問題,你可能會說,不就是一個 accept() 和兩個 recv() 嗎?這麼 容易嗎,朋友? 若是你在調用accept()的時候阻塞呢? 你怎麼可以同時接 受recv() 數據? 「用非阻塞的套接字啊!」 不行!你不想耗盡全部的CPU 吧? 那麼,該如何是好?

select()讓你能夠同時監視多個套接字。若是你想知道的話,那麼它就會告訴你哪一個套接字準備讀,哪一個又準備寫,哪一個套接字又發生了例外 (exception)。

閒話少說,下面是 select():

#include

#include

#include

int select(int numfds, fd_set *readfds, fd_set*writefds,fd_set 

*exceptfds, struct timeval *timeout);

 

這個函數監視一系列文件描述符,特別是 readfds、writefds 和exceptfds。若是你想知道你是否可以從標準輸入和套接字描述符 sockfd 讀入數據,你只要將文件描述符 0 和 sockfd 加入到集合readfds 中。參 數 numfds 應該等於最高的文件描述符的值加1。在這個例子中,你應該 設置該值爲 sockfd+1。由於它必定大於標準輸入的文件描述符 (0)。 當函數 select() 返回的時候,readfds 的值修改成反映你選擇的哪一個 文件描述符能夠讀。你能夠用下面講到的宏FD_ISSET() 來測試。在咱們繼續下去以前,讓我來說講如何對這些集合進行操做。每一個集 合類型都是fd_set。下面有一些宏來對這個類型進行操做:

FD_ZERO(fd_set*set) -清除一個文件描述符集合

FD_SET(int fd,fd_set *set) -添加fd到集合

FD_CLR(int fd,fd_set *set) -從集合中移去fd 

FD_ISSET(int fd,fd_set *set) -測試fd是否在集合中

最後,是有點古怪的數據結構 struct timeval。有時你可不想永遠等待別人發送數據過來。也許什麼事情都沒有發生的時候你也想每隔96秒在終 端上打印字符串 "Still Going..."。這個數據結構容許你設定一個時間,若是 時間到了,而select()尚未找到一個準備好的文件描述符,它將返回讓 你繼續處理。

數據結構 struct timeval 是這樣的:

struct timeval

int tv_sec;  

int tv_usec;  

}; 

只要將 tv_sec 設置爲你要等待的秒數,將 tv_usec 設置爲你要等待 的微秒數就能夠了。是的,是微秒而不是毫秒。1,000微秒等於1毫秒,1,000 毫秒等於1秒。也就是說,1秒等於1,000,000微秒。爲何用符號 "usec" 呢?字母 "u" 很象希臘字母Mu,而 Mu 表示 "微"的意思。固然,函數 返回的時候 timeout多是剩餘的時間,之因此是可能,是由於它依賴於 你的 Unix 操做系統。

哈!咱們如今有一個微秒級的定時器!別計算了,標準的Unix 系統 的時間片是100毫秒,因此不管你如何設置你的數據結構 struct timeval,你都要等待那麼長的時間。

還有一些有趣的事情:若是你設置數據結構 struct timeval 中的數據爲 0,select() 將當即超時,這樣就能夠有效地輪詢集合中的全部的文件描述 符。若是你將參數timeout 賦值爲 NULL,那麼將永遠不會發生超時,即一直等到第一個文件描述符就緒。最後,若是你不是很關心等待多長時間, 那麼就把它賦爲 NULL 吧。

下面的代碼演示了在標準輸入上等待 2.5 秒:

#include

#include

#include

#define STDIN 0  

void main() 

struct timeval tv; 

fd_set readfds; 

tv.tv_sec = 2; 

tv.tv_usec = 500000; 

FD_ZERO(&readfds); 

FD_SET(STDIN,&readfds); 

 

select(STDIN+1, &readfds, NULL,NULL, &tv); 

i f (FD_ISSET(STDIN,&readfds)) 

printf("A key waspressed!/n"); 

else 

printf("Timedout./n"); 

若是你是在一個 line buffered 終端上,那麼你敲的鍵應該是回車 (RETURN),不然不管如何它都會超時。

如今,你可能回認爲這就是在數據報套接字上等待數據的方式--你是對 的:它多是。有些 Unix 系統能夠按這種方式,而另一些則不能。你 在嘗試之前可能要先看看本系統的man page 了。

最後一件關於 select() 的事情:若是你有一個正在偵聽 (listen()) 的套 接字,你能夠經過將該套接字的文件描述符加入到readfds 集合中來看是 否有新的鏈接。

這就是我關於函數select() 要講的全部的東西。

27、參考書目:

Internetworking with TCP/IP, volumes I-III byDouglas E. Comer and 

David L. Stevens. Published by Prentice Hall.Second edition ISBNs: 

0-13-468505-9, 0-13-472242-6, 0-13-474222-2. Thereis a third edition of 

this set which covers IPv6 and IP overATM. 

Using C on the UNIX System by David A. Curry.Published by 

O'Reilly & Associates, Inc. ISBN0-937175-23-4. 

TCP/IP Network Administration by Craig Hunt.Published by O'Reilly 

& Associates, Inc. ISBN0-937175-82-X. 

TCP/IP Illustrated, volumes 1-3 by W. RichardStevens and Gary R. 

Wright. Published by Addison Wesley. ISBNs:0-201-63346-9, 

0-201-63354-X,0-201-63495-3. 

Unix Network Programming by W. Richard Stevens.Published by 

Prentice Hall. ISBN0-13-949876-1. 

On the web: 

BSD Sockets: A Quick And DirtyPrimer 

(http://www.cs.umn.edu/~bentlema/unix/--has othergreat Unix 

system programming info,too!) 

Client-ServerComputing 

(http://pandonia.canberra.edu.au/ClientServer/socket.html) 

Intro to TCP/IP (gopher)

(gopher://gopher-chem.ucdavis.edu/11/Index/Internet_aw/Intro_the_Inter

 

net/intro.to.ip/) 

Internet Protocol Frequently Asked Questions(France) 

(http://web.cnam.fr/Network/TCP-IP/) 

The Unix Socket FAQ 

(http://www.ibrado.com/sock-faq/) 

RFCs--the real dirt: 

RFC-768 -- The User Datagram Protocol

28、修改歷史

 

版本

修改描述

修改時間

V1.0

初始版本

2012-08-14

相關文章
相關標籤/搜索