1、介紹html
Socket編程讓你沮喪嗎?從man pages中很可貴到有用的信息嗎?你想跟上時代去編Internet相關的程序,可是爲你在調用 connect() 前的bind() 的結構而不知所措?等等…程序員
好在我已經將這些事完成了,我將和全部人共享個人知識了。若是你瞭解C語言並想穿過網絡編程的沼澤,那麼你來對地方了。web
2、讀者對象編程
這個文檔是一個指南,而不是參考書。若是你剛開始socket編程並想找一本入門書,那麼你是個人讀者。但這不是一本徹底的 socket 編程書。c#
3、平臺和編譯器數組
這篇文檔中的大多數代碼都在 Linux 平臺PC 上用 GNU的 gcc 成功編譯過。並且它們在HPUX平臺 上用 gcc也成功編譯過。可是注意,並非每一個代碼片斷都獨立測試過。瀏覽器
目錄服務器
1、介紹網絡
2、讀者對象數據結構
四、什麼是socket
你常常聽到人們談論着 「socket」,或許你還不知道它的確切含義。如今讓我告訴你:它是使用標準Unix 文件描述符 (file descriptor)和其它程序通信的方式。什麼?你也許聽到一些Unix高手(hacker)這樣說過:「呀,Unix中的一切就是文件!」那個傢伙也許正在說到一個事實:Unix 程序在執行任何形式的 I/O的時候,程序是在讀或者寫一個文件描述符。一個文件描述符只是一個和打開的文件相關聯的整數。可是(注意後面的話),這個文件多是一個網絡鏈接,FIFO,管道,終端,磁盤上的文件或者什麼其它的東西。Unix 中全部的東西就是文件!因此,你想和Internet上別的程序通信的時候,你將要使用到文件描述符。你必須理解剛纔的話。如今你腦海中或許冒出這樣的念頭:「那麼我從哪裏獲得網絡通信的文件描述符呢?」,這個問題不管如何我都要回答:你利用系統調用socket(),它返回套接字描述符(socketdescriptor),而後你再經過它來進行send() 和 recv()調用。「可是...」,你可能有很大的疑惑,「若是它是個文件描述符,那麼爲什 麼不用通常調用read()和write()來進行套接字通信?」簡單的答案是:「你可使用!」。詳細的答案是:「你能夠,可是使用send()和recv()讓你更好的控制數據傳輸。」存在這樣一個狀況:在咱們的世界上,有不少種套接字。有DARPA Internet 地址 (Internet 套接字),本地節點的路徑名 (Unix套接字),CCITTX.25地址 (你能夠將X.25套接字徹底忽略)。也許在你的Unix 機器上還有其它的。咱們在這裏只講第一種:Internet 套接字。
5、Internet 套接字的兩種類型
什麼意思?有兩種類型的Internet套接字?是的。不,我在撒謊。其實還有不少,可是我可不想嚇着你。咱們這裏只講兩種。除了這些, 我打算另外介紹的 "Raw Sockets" 也是很是強大的,很值得查閱。
那麼這兩種類型是什麼呢?一種是"Stream Sockets"(流格式),另一種是"DatagramSockets"(數據包格式)。咱們之後談到它們的時候也會用到"SOCK_STREAM" 和 "SOCK_DGRAM"。數據報套接字有時也叫「無鏈接套接字」(若是你確實要鏈接的時候能夠用connect()。) 流式套接字是可靠的雙向通信的數據流。若是你向套接字按順序輸出「1,2」,那麼它們將按順序「1,2」到達另外一邊。它們是無錯誤的傳遞的,有本身的錯誤控制,在此不討論。
有什麼在使用流式套接字?你可能據說過telnet,不是嗎?它就使用流式套接字。你須要你所輸入的字符按順序到達,不是嗎?一樣,WWW瀏覽器使用的 HTTP 協議也使用它們來下載頁面。實際上,當你經過端口80 telnet 到一個 WWW 站點,而後輸入 「GETpagename」 的時候,你也能夠獲得 HTML 的內容。爲何流式套接字能夠達到高質量的數據傳輸?這是由於它使用了「傳輸控制協議(The Transmission ControlProtocol)」,也叫 「TCP」 (請參考RFC-793得到詳細資料。)TCP控制你的數據按順序到達而且沒有錯
誤。你也許聽到 「TCP」 是由於聽到過 「TCP/IP」。這裏的 IP 是指「Internet 協議」(請參考 RFC-791。)IP 只是處理Internet路由而已。
那麼數據報套接字呢?爲何它叫無鏈接呢?爲何它是不可靠的呢?有這樣的一些事實:若是你發送一個數據報,它可能會到達,它可能次序顛倒了。若是它到達,那麼在這個包的內部是無錯誤的。數據報也使用IP 做路由,可是它不使用TCP。它使用「用戶數據報協議(User DatagramProtocol)」,也叫 「UDP」 (請參考RFC-768。)
爲何它們是無鏈接的呢?主要是由於它並不象流式套接字那樣維持一個鏈接。你只要創建一個包,構造一個有目標信息的IP 頭,而後發出去。無需鏈接。它們一般使用於傳輸包-包信息。簡單的應用程序有:tftp, bootp等等。
你也許會想:「假如數據丟失了這些程序如何正常工做?」個人朋友,每一個程序在UDP上有本身的協議。例如,tftp協議每發出的一個被接受到包,收到者必須發回一個包來講「我收到了!」 (一個「命令正確應答」也叫「ACK」 包)。若是在必定時間內(例如5秒),發送方沒有收到應答,它將從新發送,直到獲得 ACK。這一ACK過程在實現SOCK_DGRAM 應用程序的時候很是重要。
6、網絡理論
既然我剛纔提到了協議層,那麼如今是討論網絡究竟如何工做和一些關於 SOCK_DGRAM包是如何創建的例子。固然,你也能夠跳過這一段, 若是你認爲已經熟悉的話。
如今是學習數據封裝(Data Encapsulation)的時候了!它很是很是重要。它重要性重要到你在網絡課程學(圖1:數據封裝)習中不管如何也得也得掌握它。主要 的內容是:一個包,先是被第一個協議(在這裏是TFTP )在它的報頭(也許 是報尾)包裝(「封裝」),而後,整個數據(包括 TFTP頭)被另一個協議 (在這裏是 UDP )封裝,而後下一個(IP ),一直重複下去,直到硬件(物理)層( 這裏是以太網 )。
當另一臺機器接收到包,硬件先剝去以太網頭,內核剝去IP和UDP 頭,TFTP程序再剝去TFTP頭,最後獲得數據。如今咱們終於講到聲名狼藉的網絡分層模型 (Layered NetworkModel)。這種網絡模型在描述網絡系統上相對其它模型有不少優勢。例如,你能夠寫一個套接字程序而不用關心數據的物理傳輸(串行口,以太網,連 接單元接口 (AUI) 仍是其它介質),由於底層的程序會爲你處理它們。實際 的網絡硬件和拓撲對於程序員來講是透明的。
不說其它廢話了,我如今列出整個層次模型。若是你要參加網絡考試,可必定要記住:
應用層 (Application)
表示層 (Presentation)
會話層 (Session)
傳輸層(Transport)
網絡層(Network)
數據鏈路層(Data Link)
物理層(Physical)
物理層是硬件(串口,以太網等等)。應用層是和硬件層相隔最遠的--它 是用戶和網絡交互的地方。
這個模型如此通用,若是你想,你能夠把它做爲修車指南。把它對應 到Unix,結果是:
應用層(Application Layer) (telnet, ftp,等等)
傳輸層(Host-to-Host Transport Layer) (TCP, UDP)
Internet層(Internet Layer) (IP和路由)
網絡訪問層 (Network Access Layer)(網絡層,數據鏈路層和物理層)
如今,你可能看到這些層次如何協調來封裝原始的數據了。
看看創建一個簡單的數據包有多少工做?哎呀,你將不得不使用"cat"來創建數據包頭!這僅僅是個玩笑。對於流式套接字你要做的是 send() 發 送數據。對於數據報式套接字,你按照你選擇的方式封裝數據而後使用sendto()。內核將爲你創建傳輸層和 Internet 層,硬件完成網絡訪問層。這就是現代科技。
如今結束咱們的網絡理論速成班。哦,忘記告訴你關於路由的事情了。可是我不許備談它,若是你真的關心,那麼參考 IPRFC。
7、結構體
終於談到編程了。在這章,我將談到被套接字用到的各類數據類型。由於它們中的一些內容很重要了。
首先是簡單的一個:socket描述符。它是下面的類型:
int 僅僅是一個常見的 int。
從如今起,事情變得難以想象了,而你所需作的就是繼續看下去。注意這樣的事實:有兩種字節排列順序:重要的字節 (有時叫"octet",即八 位位組) 在前面,或者不重要的字節在前面。前一種叫「網絡字節順序 (Network ByteOrder)」。有些機器在內部是按照這個順序儲存數據,而另外 一些則否則。當我說某數據必須按照 NBO 順序,那麼你要調用函數(例如htons() )來將它從本機字節順序 (Host Byte Order) 轉換過來。若是我沒有 提到 NBO, 那麼就讓它保持本機字節順序。
個人第一個結構(在這個技術手冊TM中)--struct sockaddr。這個結構 爲許多類型的套接字儲存套接字地址信息:
structsockaddr
{
unsigned short sa_family;
char sa_data[14];
};
sa_family可以是各類各樣的類型,可是在這篇文章中都是"AF_INET"。 sa_data包含套接字中的目標地址和端口信息。這好像有點不明智。
爲了處理struct sockaddr,程序員創造了一個並列的結構: structsockaddr_in ("in"表明"Internet"。)
struct sockaddr_in
{
short int sin_family;
unsigned short int sin_port;
struct in_addr sin_addr;
unsigned char sin_zero[8];
};
用這個數據結構能夠輕鬆處理套接字地址的基本元素。注意sin_zero(它被加入到這個結構,而且長度和 structsockaddr 同樣)應該使用函數 bzero()或memset() 來所有置零。同時,這一重要的字節,一個指向 sockaddr_in結構體的指針也能夠被指向結構體sockaddr而且代替它。這 樣的話即便 socket() 想要的是 struct sockaddr *,你仍然可使用 struct sockaddr_in,而且在最後轉換。同時,注意sin_family 和 struct sockaddr 中的 sa_family 一致並可以設置爲 "AF_INET"。最後,sin_port和 sin_addr 必須是網絡字節順序 (Network Byte Order)!
你也許會反對道:"可是,怎麼讓整個數據結構 struct in_addr sin_addr 按照網絡字節順序呢?" 要知道這個問題的答案,咱們就要仔細的看一看這 個數據結構:struct in_addr, 有這樣一個聯合(unions):
struct in_addr
{
unsigned long s_addr;
};
它曾經是個最壞的聯合,可是如今那些日子過去了。若是你聲明"ina" 是數據結構 struct sockaddr_in 的實例,那麼"ina.sin_addr.s_addr" 就儲存4字節的 IP 地址(使用網絡字節順序)。若是你不幸的系統使用的仍是恐 怖的聯合 struct in_addr ,你仍是能夠放心4字節的 IP地址而且和上面 我說的同樣(這是由於使用了「#define」。)
8、本機轉換
咱們如今到了新的章節。咱們曾經講了不少網絡到本機字節順序的轉換,如今能夠實踐了!
你可以轉換兩種類型: short (兩個字節)和 long(四個字節)。這個函數對於變量類型 unsigned也適用。假設你想將 short 從本機字節順序轉換爲網絡字節順序。用 "h" 表示"本機 (host)",接着是 "to",而後用 "n" 表 示 "網絡 (network)",最後用 "s" 表示 "short": h-to-n-s, 或者 htons() ("Host to Network Short")。
太簡單了...
若是不是太傻的話,你必定想到了由"n","h","s",和"l"造成的正確組合,例如這裏確定沒有stolh() ("Short toLong Host") 函數,不只在這裏 沒有,全部場合都沒有。可是這裏有:
htons()--"Host to Network Short"
htonl()--"Host to Network Long"
ntohs()--"Network to Host Short"
ntohl()--"Network to Host Long"
如今,你可能想你已經知道它們了。你也可能想:「若是我想改變char 的順序要怎麼辦呢?」 可是你也許立刻就想到,「用不着考慮的」。你也許 會想到:個人68000機器已經使用了網絡字節順序,我沒有必要去調用htonl() 轉換 IP 地址。你多是對的,可是當你移植你的程序到別的機器 上的時候,你的程序將失敗。可移植性!這裏是Unix 世界!記住:在你將數據放到網絡上的時候,確信它們是網絡字節順序的。
最後一點:爲何在數據結構 struct sockaddr_in 中, sin_addr 和 sin_port 須要轉換爲網絡字節順序,而sin_family 需不須要呢? 答案是: sin_addr 和sin_port 分別封裝在包的 IP 和 UDP層。所以,它們必需要 是網絡字節順序。可是 sin_family 域只是被內核 (kernel) 使用來決定在數據結構中包含什麼類型的地址,因此它必須是本機字節順序。同時,sin_family沒有發送到網絡上,它們能夠是本機字節順序。
9、IP 地址和如何處理它們
如今咱們很幸運,由於咱們有不少的函數來方便地操做IP 地址。沒有必要用手工計算它們,也沒有必要用"<< span>操做來儲存成長整字型。首先,假設你已經有了一個sockaddr_in結構體ina,你有一個IP地 址"132.241.5.10"要儲存在其中,你就要用到函數inet_addr(),將IP地址從 點數格式轉換成無符號長整型。使用方法以下:
ina.sin_addr.s_addr = inet_addr("132.241.5.10");
注意,inet_addr()返回的地址已是網絡字節格式,因此你無需再調用 函數htonl()。
咱們如今發現上面的代碼片段不是十分完整的,由於它沒有錯誤檢查。顯而易見,當inet_addr()發生錯誤時返回-1。記住這些二進制數字?(無符 號數)-1僅僅和IP地址255.255.255.255相符合!這但是廣播地址!大錯特錯!記住要先進行錯誤檢查。
好了,如今你能夠將IP地址轉換成長整型了。有沒有其相反的方法呢? 它能夠將一個in_addr結構體輸出成點數格式?這樣的話,你就要用到函數inet_ntoa()("ntoa"的含義是"network to ascii"),就像這樣:
printf("%s",inet_ntoa(ina.sin_addr));
它將輸出IP地址。須要注意的是inet_ntoa()將結構體in-addr做爲一 個參數,不是長整形。一樣須要注意的是它返回的是一個指向一個字符的指針。它是一個由inet_ntoa()控制的靜態的固定的指針,因此每次調用 inet_ntoa(),它就將覆蓋上次調用時所得的IP地址。例如:
char *a1, *a2;
a1 = inet_ntoa(ina1.sin_addr);
a2 = inet_ntoa(ina2.sin_addr);
printf("address 1: %s/n",a1);
printf("address 2: %s/n",a2);
輸出以下:
address 1:132.241.5.10
address 2:132.241.5.10
假如你須要保存這個IP地址,使用strcopy()函數來指向你本身的字符 指針。
上面就是關於這個主題的介紹。稍後,你將學習將一個相似"wintehouse.gov"的字符串轉換成它所對應的IP地址(查閱域名服務,稍後)。
10、socket()函數
我想我不能再不提這個了-下面我將討論一下socket()系統調用。
下面是詳細介紹:
#include
#include
int socket(int domain, int type, intprotocol);
可是它們的參數是什麼? 首先,domain 應該設置成"AF_INET",就 象上面的數據結構struct sockaddr_in 中同樣。而後,參數 type 告訴內核 是 SOCK_STREAM 類型仍是 SOCK_DGRAM 類型。最後,把 protocol 設置爲 "0"。(注意:有不少種 domain、type,我不可能一一列出了,請看 socket() 的 man幫助。固然,還有一個"更好"的方式去獲得 protocol。同 時請查閱 getprotobyname() 的 man 幫助。)
socket()只是返回你之後在系統調用種可能用到的socket 描述符,或者在錯誤的時候返回-1。全局變量errno中將儲存返回的錯誤值。(請參考perror() 的 man 幫助。)
11、bind()函數
一旦你有一個套接字,你可能要將套接字和機器上的必定的端口關聯起來。(若是你想用listen()來偵聽必定端口的數據,這是必要一步--MUD 告 訴你說用命令 "telnet x.y.z 6969"。)若是你只想用 connect(),那麼這個步 驟沒有必要。可是不管如何,請繼續讀下去。
這裏是系統調用 bind() 的大概:
#include
#include
int bind(intsockfd, struct sockaddr *my_addr, intaddrlen);
sockfd是調用socket 返回的文件描述符。my_addr 是指向數據結構struct sockaddr 的指針,它保存你的地址(即端口和 IP 地址)信息。 addrlen 設置爲sizeof(structsockaddr)。
簡單得很不是嗎? 再看看例子:
#include
#include
#include
#define MYPORT 3490
Void main()
{
int sockfd;
struct sockaddr_in my_addr;
sockfd = socket(AF_INET, SOCK_STREAM,0);
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(MYPORT);
my_addr.sin_addr.s_addr =inet_addr("132.241.5.10");
bzero(&(my_addr.sin_zero),;
bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr));
}
這裏也有要注意的幾件事情。my_addr.sin_port 是網絡字節順序,my_addr.sin_addr.s_addr也是的。另外要注意到的事情是因系統的不一樣, 包含的頭文件也不盡相同,請查閱本地的 man 幫助文件。
在 bind() 主題中最後要說的話是,在處理本身的 IP 地址和/或端口的 時候,有些工做是能夠自動處理的。
my_addr.sin_port = 0;
my_addr.sin_addr.s_addr = INADDR_ANY;
經過將0賦給 my_addr.sin_port,你告訴 bind() 本身選擇合適的端 口。一樣,將my_addr.sin_addr.s_addr 設置爲 INADDR_ANY,你告訴 它自動填上它所運行的機器的 IP 地址。
若是你一貫當心謹慎,那麼你可能注意到我沒有將INADDR_ANY 轉換爲網絡字節順序!這是由於我知道內部的東西:INADDR_ANY 實際上就 是 0!即便你改變字節的順序,0依然是0。可是完美主義者說應該到處一 致,INADDR_ANY或許是12呢?你的代碼就不能工做了,那麼就看下面 的代碼:
my_addr.sin_port = htons(0);
my_addr.sin_addr.s_addr =htonl(INADDR_ANY);
你或許不相信,上面的代碼將能夠隨便移植。我只是想指出,既然你所遇到的程序不會都運行使用htonl的INADDR_ANY。
bind()在錯誤的時候依然是返回-1,而且設置全局錯誤變量errno。
在你調用 bind() 的時候,你要當心的另外一件事情是:不要採用小於 1024的端口號。全部小於1024的端口號都被系統保留!你能夠選擇從1024 到65535的端口(若是它們沒有被別的程序使用的話)。
你要注意的另一件小事是:有時候你根本不須要調用它。若是你使 用connect()來和遠程機器進行通信,你不須要關心你的本地端口號(就象 你在使用 telnet 的時候),你只要簡單的調用 connect() 就能夠了,它會檢查套接字是否綁定端口,若是沒有,它會本身綁定一個沒有使用的本地端口。
12、connect()程序
如今咱們假設你是個 telnet 程序。你的用戶命令你獲得套接字的文件描述符。你遵從命令調用了socket()。下一步,你的用戶告訴你經過端口 23(標準 telnet 端口)鏈接到"132.241.5.10"。你該怎麼作呢? 幸運的是,你正在閱讀 connect()--如何鏈接到遠程主機這一章。你可 不想讓你的用戶失望。
connect()系統調用是這樣的:
#include
#include
int connect(int sockfd, struct sockaddr*serv_addr, int addrlen);
sockfd是系統調用socket() 返回的套接字文件描述符。serv_addr 是 保存着目的地端口和 IP 地址的數據結構 struct sockaddr。addrlen 設置 爲 sizeof(struct sockaddr)。
想知道得更多嗎?讓咱們來看個例子:
#include
#include
#include
#define DEST_IP"132.241.5.10"
#define DEST_PORT 23
main()
{
int sockfd;
struct sockaddr_in dest_addr;
sockfd = socket(AF_INET, SOCK_STREAM, 0);
dest_addr.sin_family = AF_INET;
dest_addr.sin_port = htons(DEST_PORT);
dest_addr.sin_addr.s_addr =inet_addr(DEST_IP);
bzero(&(dest_addr.sin_zero),;
connect(sockfd, (struct sockaddr*)&dest_addr, sizeof(struct sockaddr));
}
再一次,你應該檢查 connect() 的返回值--它在錯誤的時候返回-1,並 設置全局錯誤變量 errno。
同時,你可能看到,我沒有調用 bind()。由於我不在意本地的端口號。我只關心我要去那。內核將爲我選擇一個合適的端口號,而咱們所鏈接的 地方也自動地得到這些信息。一切都不用擔憂。
13、listen()函數
是換換內容得時候了。假如你不但願與遠程的一個地址相連,或者說,僅僅是將它踢開,那你就須要等待接入請求而且用各類方法處理它們。處 理過程分兩步:首先,你聽--listen(),而後,你接受--accept() (請看下面的 內容)。
除了要一點解釋外,系統調用 listen 也至關簡單。
int listen(intsockfd, int backlog);
sockfd是調用socket() 返回的套接字文件描述符。backlog 是在進入 隊列中容許的鏈接數目。什麼意思呢? 進入的鏈接是在隊列中一直等待直 到你接受 (accept() 請看下面的文章)鏈接。它們的數目限制於隊列的容許。 大多數系統的容許數目是20,你也能夠設置爲5到10。
和別的函數同樣,在發生錯誤的時候返回-1,並設置全局錯誤變量 errno。
你可能想象到了,在你調用 listen() 前你或者要調用 bind() 或者讓內核隨便選擇一個端口。若是你想偵聽進入的鏈接,那麼系統調用的順序可 能是這樣的:
socket();
bind();
listen();
由於它至關的明瞭,我將在這裏不給出例子了。(在 accept() 那一章的 代碼將更加徹底。)真正麻煩的部分在 accept()。
14、accept()函數
準備好了,系統調用 accept() 會有點古怪的地方的!你能夠想象發生這樣的事情:有人從很遠的地方經過一個你在偵聽 (listen()) 的端口鏈接 (connect()) 到你的機器。它的鏈接將加入到等待接受 (accept()) 的隊列 中。你調用 accept() 告訴它你有空閒的鏈接。它將返回一個新的套接字文件描述符!這樣你就有兩個套接字了,原來的一個還在偵聽你的那個端口, 新的在準備發送 (send()) 和接收 ( recv()) 數據。這就是這個過程!
函數是這樣定義的:
#include
int accept(intsockfd, void *addr, int *addrlen);
sockfd至關簡單,是和listen() 中同樣的套接字描述符。addr 是個指 向局部的數據結構 sockaddr_in 的指針。這是要求接入的信息所要去的地方(你能夠測定那個地址在那個端口呼叫你)。在它的地址傳遞給 accept 之 前,addrlen 是個局部的整形變量,設置爲 sizeof(struct sockaddr_in)。 accept 將不會將多餘的字節給 addr。若是你放入的少些,那麼它會經過改
變 addrlen 的值反映出來。
一樣,在錯誤時返回-1,並設置全局錯誤變量 errno。
如今是你應該熟悉的代碼片斷。
#include
#include
#include
#define MYPORT 3490
#define BACKLOG 10
main()
{
int sockfd, new_fd;
struct sockaddr_in my_addr;
struct sockaddr_in their_addr;
int sin_size;
sockfd = socket(AF_INET, SOCK_STREAM, 0);
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(MYPORT);
my_addr.sin_addr.s_addr = INADDR_ANY;
bzero(&(my_addr.sin_zero),;
bind(sockfd, (struct sockaddr*)&my_addr, sizeof(structsockaddr));
listen(sockfd,BACKLOG);
sin_size = sizeof(structsockaddr_in);
new_fd = accept(sockfd,&their_addr,&sin_size);
}
注意,在系統調用 send() 和 recv() 中你應該使用新的套接字描述符 new_fd。若是你只想讓一個鏈接進來,那麼你可使用 close() 去關閉原 來的文件描述符 sockfd 來避免同一個端口更多的鏈接。
15、send() and recv()函數
這兩個函數用於流式套接字或者數據報套接字的通信。若是你喜歡使用無鏈接的數據報套接字,你應該看一看下面關於sendto() 和recvfrom() 的章節。
send()是這樣的:
int send(intsockfd, const void *msg, int len, intflags);
sockfd是你想發送數據的套接字描述符(或者是調用 socket() 或者是accept() 返回的。)msg 是指向你想發送的數據的指針。len 是數據的長度。 把 flags 設置爲 0 就能夠了。(詳細的資料請看send() 的 manpage)。
這裏是一些可能的例子:
char *msg = "Beej washere!";
int len, bytes_sent;
len = strlen(msg);
bytes_sent = send(sockfd, msg, len,0);
send()返回實際發送的數據的字節數--它可能小於你要求發送的數 目!注意,有時候你告訴它要發送一堆數據但是它不能處理成功。它只是 發送它可能發送的數據,而後但願你可以發送其它的數據。記住,若是send() 返回的數據和len不匹配,你就應該發送其它的數據。可是這裏也 有個好消息:若是你要發送的包很小(小於大約 1K),它可能處理讓數據一 次發送完。最後要說得就是,它在錯誤的時候返回-1,並設置 errno。
recv()函數很類似:
int recv(intsockfd, void *buf, int len, unsigned int flags);
sockfd是要讀的套接字描述符。buf 是要讀的信息的緩衝。len 是緩 衝的最大長度。flags 能夠設置爲0。(請參考recv() 的 manpage。) recv()返回實際讀入緩衝的數據的字節數。或者在錯誤的時候返回-1, 同時設置 errno。
很簡單,不是嗎? 你如今能夠在流式套接字上發送數據和接收數據了。 你如今是 Unix 網絡程序員了!
16、sendto() 和 recvfrom()函數
「這很不錯啊」,你說,「可是你尚未講無鏈接數據報套接字呢?」沒問題,如今咱們開始這個內容。
既然數據報套接字不是鏈接到遠程主機的,那麼在咱們發送一個包以前須要什麼信息呢?不錯,是目標地址!看看下面的:
int sendto(intsockfd, const void *msg, int len, unsigned intflags,
const struct sockaddr *to, inttolen);
你已經看到了,除了另外的兩個信息外,其他的和函數send() 是同樣 的。to 是個指向數據結構 struct sockaddr 的指針,它包含了目的地的IP 地址和端口信息。tolen 能夠簡單地設置爲 sizeof(struct sockaddr)。 和函數 send() 相似,sendto() 返回實際發送的字節數(它也可能小於 你想要發送的字節數!),或者在錯誤的時候返回 -1。
類似的還有函數 recv() 和 recvfrom()。recvfrom() 的定義是這樣的:
int recvfrom(int sockfd, void *buf, int len,unsigned int flags,struct sockaddr *from, int *fromlen);
又一次,除了兩個增長的參數外,這個函數和 recv() 也是同樣的。from 是一個指向局部數據結構 struct sockaddr 的指針,它的內容是源機器的 IP 地址和端口信息。fromlen 是個 int 型的局部指針,它的初始值爲 sizeof(struct sockaddr)。函數調用返回後,fromlen 保存着實際儲存在 from 中的地址的長度。
recvfrom()返回收到的字節長度,或者在發生錯誤後返回 -1。
記住,若是你用 connect() 鏈接一個數據報套接字,你能夠簡單的調 用 send() 和 recv() 來知足你的要求。這個時候依然是數據報套接字,依 然使用UDP,系統套接字接口會爲你自動加上了目標和源的信息。
17、close()和shutdown()函數
你已經成天都在發送 (send()) 和接收 (recv()) 數據了,如今你準備關 閉你的套接字描述符了。這很簡單,你可使用通常的Unix 文件描述符 的 close() 函數:
close(sockfd);
它將防止套接字上更多的數據的讀寫。任何在另外一端讀寫套接字的企圖都將返回錯誤信息。
若是你想在如何關閉套接字上有多一點的控制,你可使用函數shutdown()。它容許你將必定方向上的通信或者雙向的通信(就象close()一 樣)關閉,你可使用:
int shutdown(intsockfd, int how);
sockfd是你想要關閉的套接字文件描述復。how 的值是下面的其中之 一:
0 - 不容許接受
1 - 不容許發送
2 - 不容許發送和接受(和close()同樣)
shutdown()成功時返回 0,失敗時返回 -1(同時設置 errno。)若是在無鏈接的數據報套接字中使用shutdown(),那麼只不過是讓 send() 和 recv() 不能使用(記住你在數據報套接字中使用了 connect 後 是可使用它們的)。
18、getpeername()函數
這個函數太簡單了。
它太簡單了,以致我都不想單列一章。可是我仍是這樣作了。 函數getpeername()告訴你在鏈接的流式套接字上誰在另一邊。函 數是這樣的:
#include
int getpeername(int sockfd, struct sockaddr *addr,int *addrlen);
sockfd是鏈接的流式套接字的描述符。addr 是一個指向結構 struct sockaddr (或者是 struct sockaddr_in) 的指針,它保存着鏈接的另外一邊的 信息。addrlen 是一個 int 型的指針,它初始化爲sizeof(struct sockaddr)。 函數在錯誤的時候返回 -1,設置相應的 errno。
一旦你得到它們的地址,你可使用 inet_ntoa() 或者 gethostbyaddr()來打印或者得到更多的信息。可是你不能獲得它的賬號。(若是它運行着愚 蠢的守護進程,這是可能的,可是它的討論已經超出了本文的範圍,請參考RFC-1413以得到更多的信息。)
19、gethostname()函數
甚至比 getpeername() 還簡單的函數是 gethostname()。它返回你程 序所運行的機器的主機名字。而後你可使用gethostbyname() 以得到你的機器的 IP 地址。
下面是定義:
#include
intgethostname(char *hostname, size_t size);
參數很簡單:hostname 是一個字符數組指針,它將在函數返回時保存
主機名。size是hostname 數組的字節長度。
函數調用成功時返回 0,失敗時返回 -1,並設置errno。
20、域名服務(DNS)
若是你不知道 DNS 的意思,那麼我告訴你,它表明域名服務(Domain NameService)。它主要的功能是:你給它一個容易記憶的某站點的地址, 它給你 IP 地址(而後你就可使用 bind(), connect(), sendto() 或者其它 函數) 。當一我的輸入:
$ telnet whitehouse.gov
telnet能知道它將鏈接(connect()) 到 "198.137.240.100"。
可是這是如何工做的呢? 你能夠調用函數 gethostbyname():
#include
struct hostent *gethostbyname(const char*name);
很明白的是,它返回一個指向 struct hostent 的指針。這個數據結構 是這樣的:
struct hostent
{
char *h_name;
char **h_aliases;
int h_addrtype;
int h_length;
char **h_addr_list;
};
#define h_addrh_addr_list[0]
這裏是這個數據結構的詳細資料:
structhostent:
h_name - 地址的正式名稱。
h_aliases - 空字節-地址的預備名稱的指針。
h_addrtype -地址類型; 一般是AF_INET。
h_length - 地址的比特長度。
h_addr_list - 零字節-主機網絡地址指針。網絡字節順序。
h_addr - h_addr_list中的第一地址。
gethostbyname()成功時返回一個指向結構體 hostent 的指針,或者 是個空 (NULL) 指針。(可是和之前不一樣,不設置errno,h_errno 設置錯 誤信息。請看下面的 herror()。)
可是如何使用呢? 有時候(咱們能夠從電腦手冊中發現),向讀者灌輸信息是不夠的。這個函數可不象它看上去那麼難用。
這裏是個例子:
#include
#include
#include
#include
#include
#include
int main(int argc, char *argv[])
{
struct hostent *h;
if (argc != 2)
{
fprintf(stderr,"usage: getip address/n");
exit(1);
}
if ((h=gethostbyname(argv[1])) == NULL)
{
herror("gethostbyname");
exit(1);
}
printf("Host name : %s/n",h->h_name);
printf("IP Address : %s/n",inet_ntoa(*((structin_addr *)h->h_addr)));
return 0;
}
在使用 gethostbyname() 的時候,你不能用 perror() 打印錯誤信息 (由於 errno 沒有使用),你應該調用 herror()。
至關簡單,你只是傳遞一個保存機器名的字符串(例如 "whitehouse.gov") 給 gethostbyname(),而後從返回的數據結構 struct hostent 中獲取信息。
惟一也許讓人不解的是輸出 IP 地址信息。h->h_addr 是一個 char *, 可是 inet_ntoa() 須要的是 struct in_addr。所以,我轉換 h->h_addr 成 struct in_addr *,而後獲得數據。
21、客戶-服務器背景知識
這裏是個客戶--服務器的世界。在網絡上的全部東西都是在處理客戶進程和服務器進程的交談。舉個telnet的例子。當你用 telnet(客戶)經過23 號端口登錄到主機,主機上運行的一個程序(通常叫 telnetd,服務器)激活。 它處理這個鏈接,顯示登錄界面,等等。
圖2:客戶機和服務器的關係
圖 2 說明了客戶和服務器之間的信息交換。
注意,客戶--服務器之間可使用SOCK_STREAM、SOCK_DGRAM 或者其它(只要它們採用相同的)。一些很好的客戶--服務器的例子有telnet/telnetd、 ftp/ftpd 和bootp/bootpd。每次你使用 ftp 的時候,在遠 端都有一個 ftpd 爲你服務。
通常,在服務端只有一個服務器,它採用 fork() 來處理多個客戶的鏈接。基本的程序是:服務器等待一個鏈接,接受(accept()) 鏈接,而後 fork() 一個子進程處理它。這是下一章咱們的例子中會講到的。
22、簡單的服務器
這個服務器所作的所有工做是在流式鏈接上發送字符串"Hello,World!/n"。你要測試這個程序的話,能夠在一臺機器上運行該程序,而後 在另一機器上登錄:
$ telnet remotehostname3490
remotehostname是該程序運行的機器的名字。
服務器代碼:
#include
#include
#include
#include
#include
#include
#include
#include
#define MYPORT 3490
#define BACKLOG 10
main()
{
int sockfd, new_fd;
struct sockaddr_in my_addr;
struct sockaddr_in their_addr;
int sin_size;
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)
{
perror("socket");
exit(1);
}
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(MYPORT);
my_addr.sin_addr.s_addr =INADDR_ANY;
bzero(&(my_addr.sin_zero),;
if (bind(sockfd, (struct sockaddr*)&my_addr,sizeof(struct sockaddr))== -1)
{
perror("bind");
exit(1);
}
if (listen(sockfd, BACKLOG) == -1)
{
perror("listen");
exit(1);
}
while(1) {
sin_size = sizeof(structsockaddr_in);
if ((new_fd = accept(sockfd,(struct sockaddr *)&their_addr,/
&sin_size)) ==-1)
{
perror("accept");
continue;
}
printf("server: got connectionfrom %s/n", /
inet_ntoa(their_addr.sin_addr));
if (!fork())
{
if (send(new_fd, "Hello, world!/n", 14, 0) ==-1)
perror("send");
close(new_fd);
exit(0);
}
close(new_fd);
while(waitpid(-1,NULL,WNOHANG) >0);
}
}
若是你很挑剔的話,必定不滿意我全部的代碼都在一個很大的main() 函數中。若是你不喜歡,能夠劃分得更細點。
你也能夠用咱們下一章中的程序獲得服務器端發送的字符串。
23、簡單的客戶程序
這個程序比服務器還簡單。這個程序的全部工做是經過3490端口鏈接到命令行中指定的主機,而後獲得服務器發送的字符串。
客戶代碼:
#include
#include
#include
#include
#include
#include
#include
#include
#define PORT 3490
#define MAXDATASIZE 100
int main(int argc, char*argv[])
{
int sockfd,numbytes;
charbuf[MAXDATASIZE];
struct hostent*he;
struct sockaddr_in their_addr;
if (argc != 2)
{
Fprintf(stderr,"usage: clienthostname/n");
exit(1);
}
if ((he=gethostbyname(argv[1])) ==NULL)
{
herror("gethostbyname");
exit(1);
}
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) ==-1)
{
perror("socket");
exit(1);
}
their_addr.sin_family = AF_INET;
their_addr.sin_port = htons(PORT);
their_addr.sin_addr = *((struct in_addr*)he->h_addr);
bzero(&(their_addr.sin_zero),;
if (connect(sockfd, (struct sockaddr*)&their_addr,sizeof(struct
sockaddr)) == -1)
{
perror("connect");
exit(1);
}
if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0))== -1)
{
perror("recv");
exit(1);
}
buf[numbytes] = '/0';
printf("Received:%s",buf);
close(sockfd);
return 0;
}
注意,若是你在運行服務器以前運行客戶程序,connect() 將返回 "Connection refused" 信息,這很是有用。
24、數據包Sockets
我不想講更多了,因此我給出代碼 talker.c 和 listener.c。
listener在機器上等待在端口4590 來的數據包。talker 發送數據包到必定的機器,它包含用戶在命令行輸入的內容。
這裏就是 listener.c:
#include
#include
#include
#include
#include
#include
#include
#include
#define MYPORT 4950
#define MAXBUFLEN 100
Void main()
{
intsockfd;
struct sockaddr_in my_addr;
struct sockaddr_in their_addr;
int addr_len,numbytes;
charbuf[MAXBUFLEN];
if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)
{
perror("socket");
exit(1);
}
my_addr.sin_family = AF_INET;
my_addr.sin_port =htons(MYPORT);
my_addr.sin_addr.s_addr =INADDR_ANY;
bzero(&(my_addr.sin_zero),;
if (bind(sockfd, (struct sockaddr*)&my_addr, sizeof(struct sockaddr))==-1){
perror("bind");
exit(1);
}
addr_len = sizeof(structsockaddr);
if ((numbytes=recvfrom(sockfd,buf, MAXBUFLEN, 0, /
(struct sockaddr*)&their_addr, &addr_len)) ==-1)
{
perror("recvfrom");
exit(1);
}
printf("got packet from%s/n",inet_ntoa(their_addr.sin_addr));
printf("packet is %d byteslong/n",numbytes);
buf[numbytes] ='/0';
printf("packet contains/"%s/"/n",buf);
close(sockfd);
}
注意在咱們的調用 socket(),咱們最後使用了 SOCK_DGRAM。同時, 沒有必要去使用 listen() 或者 accept()。咱們在使用無鏈接的數據報套接 字!
下面是 talker.c:
#include
#include
#include
#include
#include
#include
#include
#include
#define MYPORT 4950
int main(int argc, char*argv[])
{
intsockfd;
struct sockaddr_in their_addr;
struct hostent*he;
int numbytes;
if (argc != 3)
{
fprintf(stderr,"usage: talker hostnamemessage/n");
exit(1);
}
if ((he=gethostbyname(argv[1])) ==NULL)
{
herror("gethostbyname");
exit(1);
}
if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) ==-1)
{
perror("socket");
exit(1);
}
their_addr.sin_family = AF_INET;
their_addr.sin_port =htons(MYPORT);
their_addr.sin_addr = *((structin_addr*)he->h_addr);
bzero(&(their_addr.sin_zero),;
if ((numbytes=sendto(sockfd, argv[2],strlen(argv[2]), 0, /
(struct sockaddr*)&their_addr, sizeof(struct sockaddr))) ==-1)
{
perror("sendto");
exit(1);
}
printf("sent %d bytes to %s/n",numbytes,inet_ntoa(their_addr.sin_addr));
close(sockfd);
return 0;
}
這就是全部的了。在一臺機器上運行 listener,而後在另一臺機器上 運行 talker。觀察它們的通信!
除了一些我在上面提到的數據套接字鏈接的小細節外,對於數據套接字,我還得說一些,當一個講話者呼叫connect()函數時並指定接受者的地 址時,從這點能夠看出,講話者只能向connect()函數指定的地址發送和接受信息。所以,你不須要使用sendto()和recvfrom(),你徹底能夠用send() 和recv()代替。
25、阻塞
阻塞,你也許早就據說了。"阻塞"是"sleep"的科技行話。你可能注意 到前面運行的 listener 程序,它在那裏不停地運行,等待數據包的到來。 實際在運行的是它調用recvfrom(),而後沒有數據,所以recvfrom() 說" 阻塞(block)",直到數據的到來。
不少函數都利用阻塞。accept() 阻塞,全部的 recv*() 函數阻塞。它 們之因此能這樣作是由於它們被容許這樣作。當你第一次調用socket() 創建套接字描述符的時候,內核就將它設置爲阻塞。若是你不想套接字阻塞, 你就要調用函數 fcntl():
#include
#include
sockfd = socket(AF_INET, SOCK_STREAM,0);
fcntl(sockfd, F_SETFL,O_NONBLOCK);
經過設置套接字爲非阻塞,你可以有效地"詢問"套接字以得到信息。如 果你嘗試着從一個非阻塞的套接字讀信息而且沒有任何數據,它不容許阻塞--它將返回 -1 並將errno 設置爲 EWOULDBLOCK。
可是通常說來,這種詢問不是個好主意。若是你讓你的程序在忙等狀態查詢套接字的數據,你將浪費大量的 CPU時間。更好的解決之道是用 下一章講的 select() 去查詢是否有數據要讀進來。
26、select()--多路同步 I/O
雖然這個函數有點奇怪,可是它頗有用。假設這樣的狀況:你是個服務器,你一邊在不停地從鏈接上讀數據,一邊在偵聽鏈接上的信息。 沒問題,你可能會說,不就是一個 accept() 和兩個 recv() 嗎?這麼 容易嗎,朋友? 若是你在調用accept()的時候阻塞呢? 你怎麼可以同時接 受recv() 數據? 「用非阻塞的套接字啊!」 不行!你不想耗盡全部的CPU 吧? 那麼,該如何是好?
select()讓你能夠同時監視多個套接字。若是你想知道的話,那麼它就會告訴你哪一個套接字準備讀,哪一個又準備寫,哪一個套接字又發生了例外 (exception)。
閒話少說,下面是 select():
#include
#include
#include
int select(int numfds, fd_set *readfds, fd_set*writefds,fd_set
*exceptfds, struct timeval *timeout);
這個函數監視一系列文件描述符,特別是 readfds、writefds 和exceptfds。若是你想知道你是否可以從標準輸入和套接字描述符 sockfd 讀入數據,你只要將文件描述符 0 和 sockfd 加入到集合readfds 中。參 數 numfds 應該等於最高的文件描述符的值加1。在這個例子中,你應該 設置該值爲 sockfd+1。由於它必定大於標準輸入的文件描述符 (0)。 當函數 select() 返回的時候,readfds 的值修改成反映你選擇的哪一個 文件描述符能夠讀。你能夠用下面講到的宏FD_ISSET() 來測試。在咱們繼續下去以前,讓我來說講如何對這些集合進行操做。每一個集 合類型都是fd_set。下面有一些宏來對這個類型進行操做:
FD_ZERO(fd_set*set) -清除一個文件描述符集合
FD_SET(int fd,fd_set *set) -添加fd到集合
FD_CLR(int fd,fd_set *set) -從集合中移去fd
FD_ISSET(int fd,fd_set *set) -測試fd是否在集合中
最後,是有點古怪的數據結構 struct timeval。有時你可不想永遠等待別人發送數據過來。也許什麼事情都沒有發生的時候你也想每隔96秒在終 端上打印字符串 "Still Going..."。這個數據結構容許你設定一個時間,若是 時間到了,而select()尚未找到一個準備好的文件描述符,它將返回讓 你繼續處理。
數據結構 struct timeval 是這樣的:
struct timeval
{
int tv_sec;
int tv_usec;
};
只要將 tv_sec 設置爲你要等待的秒數,將 tv_usec 設置爲你要等待 的微秒數就能夠了。是的,是微秒而不是毫秒。1,000微秒等於1毫秒,1,000 毫秒等於1秒。也就是說,1秒等於1,000,000微秒。爲何用符號 "usec" 呢?字母 "u" 很象希臘字母Mu,而 Mu 表示 "微"的意思。固然,函數 返回的時候 timeout多是剩餘的時間,之因此是可能,是由於它依賴於 你的 Unix 操做系統。
哈!咱們如今有一個微秒級的定時器!別計算了,標準的Unix 系統 的時間片是100毫秒,因此不管你如何設置你的數據結構 struct timeval,你都要等待那麼長的時間。
還有一些有趣的事情:若是你設置數據結構 struct timeval 中的數據爲 0,select() 將當即超時,這樣就能夠有效地輪詢集合中的全部的文件描述 符。若是你將參數timeout 賦值爲 NULL,那麼將永遠不會發生超時,即一直等到第一個文件描述符就緒。最後,若是你不是很關心等待多長時間, 那麼就把它賦爲 NULL 吧。
下面的代碼演示了在標準輸入上等待 2.5 秒:
#include
#include
#include
#define STDIN 0
void main()
{
struct timeval tv;
fd_set readfds;
tv.tv_sec = 2;
tv.tv_usec = 500000;
FD_ZERO(&readfds);
FD_SET(STDIN,&readfds);
select(STDIN+1, &readfds, NULL,NULL, &tv);
i f (FD_ISSET(STDIN,&readfds))
printf("A key waspressed!/n");
else
printf("Timedout./n");
}
若是你是在一個 line buffered 終端上,那麼你敲的鍵應該是回車 (RETURN),不然不管如何它都會超時。
如今,你可能回認爲這就是在數據報套接字上等待數據的方式--你是對 的:它多是。有些 Unix 系統能夠按這種方式,而另一些則不能。你 在嘗試之前可能要先看看本系統的man page 了。
最後一件關於 select() 的事情:若是你有一個正在偵聽 (listen()) 的套 接字,你能夠經過將該套接字的文件描述符加入到readfds 集合中來看是 否有新的鏈接。
這就是我關於函數select() 要講的全部的東西。
27、參考書目:
Internetworking with TCP/IP, volumes I-III byDouglas E. Comer and
David L. Stevens. Published by Prentice Hall.Second edition ISBNs:
0-13-468505-9, 0-13-472242-6, 0-13-474222-2. Thereis a third edition of
this set which covers IPv6 and IP overATM.
Using C on the UNIX System by David A. Curry.Published by
O'Reilly & Associates, Inc. ISBN0-937175-23-4.
TCP/IP Network Administration by Craig Hunt.Published by O'Reilly
& Associates, Inc. ISBN0-937175-82-X.
TCP/IP Illustrated, volumes 1-3 by W. RichardStevens and Gary R.
Wright. Published by Addison Wesley. ISBNs:0-201-63346-9,
0-201-63354-X,0-201-63495-3.
Unix Network Programming by W. Richard Stevens.Published by
Prentice Hall. ISBN0-13-949876-1.
On the web:
BSD Sockets: A Quick And DirtyPrimer
(http://www.cs.umn.edu/~bentlema/unix/--has othergreat Unix
system programming info,too!)
Client-ServerComputing
(http://pandonia.canberra.edu.au/ClientServer/socket.html)
Intro to TCP/IP (gopher)
(gopher://gopher-chem.ucdavis.edu/11/Index/Internet_aw/Intro_the_Inter
net/intro.to.ip/)
Internet Protocol Frequently Asked Questions(France)
(http://web.cnam.fr/Network/TCP-IP/)
The Unix Socket FAQ
(http://www.ibrado.com/sock-faq/)
RFCs--the real dirt:
RFC-768 -- The User Datagram Protocol
28、修改歷史
版本 |
修改描述 |
修改時間 |
|
V1.0 |
初始版本 |
2012-08-14 |