Linux網絡編程之套接字基礎

1.套接字的基本結構程序員

struct sockaddr編程

這個結構用來存儲套接字地址。數組

數據定義:緩存

struct sockaddr {服務器

unsigned short sa_family; /* address族, AF_xxx */網絡

char sa_data[14]; /* 14 bytes的協議地址 */dom

};socket

sa_family 通常來講,都是「AFINET」。函數

sa_data 包含了一些遠程電腦的地址、端口和套接字的數目,它裏面的數據是雜溶在一指針

切的。

爲了處理struct sockaddr, 程序員創建了另一個類似的結構 struct sockaddr_in:

struct sockaddr_in (「in」 表明 「Internet」)

struct sockaddr_in {

short int sin_family; /* Internet地址族 */

unsigned short int sin_port; /* 端口號 */

struct in_addr sin_addr; /* Internet地址 */

unsigned char sin_zero[8]; /* 添0(和struct sockaddr同樣大小)*/

};

這個結構提供了方便的手段來訪問socket address(struct sockaddr)結構中的每個元

2.套接字字節轉換程序的列表:

l htons()——「Host to Network Short」主機字節順序轉換爲網絡字節順序(對無符號

短型進行操做4 bytes)

l htonl()——「Host to Network Long」 主機字節順序轉換爲網絡字節順序(對無符

號長型進行操做8 bytes)

l ntohs()——「Network to Host Short 「 網絡字節順序轉換爲主機字節順序(對無符

號短型進行操做4 bytes)

l ntohl()——「Network to Host Long 「 網絡字節順序轉換爲主機字節順序(對無符

號長型進行操做8 bytes)

3. IP 地址轉換

Linux 系統提供和不少用於轉換IP 地址的函數.首先,假設你有一個struct sockaddr_in ina,而且你的IP 是166.111.69.52 ,你想把你的IP 存儲到ina 中。你可使用的函數: inet_addr() ,它可以把一個用數字和點表

示IP 地址的字符串轉換成一個無符號長整型。你能夠像下面這樣使用它:

ina.sin_addr.s_addr = inet_addr(「166.111.69.52」);

注意:

l inet_addr() 返回的地址已是網絡字節順序了,你沒有必要再去調用htonl() 函數

反過來,若是你有一個struct in_addr 而且你想把它表明的IP 地址打印出來(按照數字.數字.數字.數字的格式),那麼你可使用函數inet_ntoa()(「ntoa」表明「Network to ASCII」),它會把struct in_addr 裏面存儲的網絡地址以數字.數字.數字.數字的格式。

l inet_ntoa() 使用struct in_addr 做爲一個參數,不是一個長整型值。

4.基本套接字調用

socket() 函數

取得套接字描述符

 socket 函數的定義是下面這樣子的:

#include <sys/types.h>

#include <sys/socket.h>

int socket(int domain , int type , int protocol);

bind() 函數

bind()函數能夠幫助你指定一個套接字使用的端口。

當你使用socket() 函數獲得一個套接字描述符,你也許須要將socket 綁定上一個你的

機器上的端口。

l 當你須要進行端口監聽 listen()操做,等待接受一個連入請求的時候,通常都須要

通過這一步。好比網絡泥巴(MUD),Telnet a.b.c.d 4000。

l 若是你只是想進行鏈接一臺服務器,也就是進行 connect() 操做的時候,這一步

並非必須的。

bind()的系統調用聲明以下:

#include <sys/types.h>

#include <sys/socket.h>

int bind (int sockfd , struct sockaddr *my_addr , int addrlen) ;

參數說明:

l sockfd 是由socket()函數返回的套接字描述符。

l my_addr 是一個指向struct sockaddr 的指針,包含有關你的地址的信息:名稱、

端口和IP 地址。

l addrlen 能夠設置爲sizeof(struct sockaddr)。

connect()函數

讓咱們花一點時間來假設你是一個Telnet 應用程序。你的使用者命令你創建一個套接

字描述符。你聽從命令,調用了socket()。而後,使用者告訴你鏈接到「166.111.69.52」

的23 端口(標準的Telnet 端口)⋯⋯你應該怎麼作呢?

你很幸運:Telnet 應用程序,你如今正在閱讀的就是套接字的進行網絡鏈接部分:

connect()。

connect() 函數的定義是這樣的:

#include <sys/types.h>

#include <sys/socket.h>

int connect (int sockfd, struct sockaddr *serv_addr, int addrlen);

connect()的三個參數意義以下:

l sockfd :套接字文件描述符,由socket()函數返回的。

l serv_addr 是一個存儲遠程計算機的IP 地址和端口信息的結構。

l addrlen 應該是sizeof(struct sockaddr)。

listen() 函數

listen()函數是等待別人鏈接,進行系統偵聽請求的函數。當有人鏈接你的時候,你有

兩步須要作:經過listen()函數等待鏈接請求,而後使用accept()函數來處理。(accept()函數

在下面介紹)。

listen()函數調用是很是簡單的。函數聲明以下:

#include <sys/socket.h>

int listen(int sockfd, int backlog);

listen()函數的參數意義以下:

l sockfd 是一個套接字描述符,由socket()系統調用得到。

l backlog 是未通過處理的鏈接請求隊列能夠容納的最大數目。

backlog 具體一些是什麼意思呢?每個連入請求都要進入一個連入請求隊列,等待

listen 的程序調用accept()(accept()函數下面有介紹)函數來接受這個鏈接。當系統尚未

調用accept()函數的時候,若是有不少鏈接,那麼本地可以等待的最大數目就是backlog 的

數值。你能夠將其設成5 到10 之間的數值

accept()函數

函數accept()有一些難懂。當調用它的時候,大體過程是下面這樣的:

l 有人從很遠很遠的地方嘗試調用 connect()來鏈接你的機器上的某個端口(固然是

你已經在listen()的)。

l 他的鏈接將被 listen 加入等待隊列等待accept()函數的調用(加入等待隊列的最多

數目由調用listen()函數的第二個參數backlog 來決定)。

l 你調用 accept()函數,告訴他你準備鏈接。

l accept()函數將回返回一個新的套接字描述符,這個描述符就表明了這個鏈接!

好,這時候你有了兩個套接字描述符,返回給你的那個就是和遠程計算機的鏈接,而

第一個套接字描述符仍然在你的機器上原來的那個端口上listen()。

這時候你所獲得的那個新的套接字描述符就能夠進行send()操做和recv()操做了。

下面是accept()函數的聲明:

#include <sys/socket.h>

int accept(int sockfd, void *addr, int *addrlen);

accept()函數的參數意義以下:

l sockfd 是正在listen() 的一個套接字描述符。

l addr 通常是一個指向struct sockaddr_in 結構的指針;裏面存儲着遠程鏈接過來的

計算機的信息(好比遠程計算機的IP 地址和端口)

send()、recv()函數

這兩個函數是最基本的,經過有鏈接的套接字流進行通信的函數。

send() 函數的聲明:

#include <sys/types.h>

#include <sys/socket.h>

int send(int sockfd, const void *msg, int len, int flags);

send 的參數含義以下:

l sockfd 是表明你與遠程程序鏈接的套接字描述符。

l msg 是一個指針,指向你想發送的信息的地址。

l len 是你想發送信息的長度。

l flags 發送標記。通常都設爲0

函數recv()調用在許多方面都和send()很類似,下面是recv()函數的聲明:

#include <sys/types.h>

#include <sys/socket.h>

int recv(int sockfd, void *buf, int len, unsigned int flags);

recv()的參數含義以下:

l sockfd 是你要讀取數據的套接字描述符。

l buf 是一個指針,指向你能存儲數據的內存緩存區域。

l len 是緩存區的最大尺寸。

l flags 是recv() 函數的一個標誌,通常都爲0 (具體的其餘數值和含義請參考recv()

的man pages)。

recv() 返回它所真正收到的數據的長度

sendto() 和recvfrom() 函數

這兩個函數是進行無鏈接的UDP 通信時使用的。使用這兩個函數,則數據會在沒有

創建過任何鏈接的網絡上傳輸。由於數據報套接字沒法對遠程主機進行鏈接,想一想咱們在

發送數據前須要知道些什麼呢?

對了!是遠程主機的IP 地址和端口!

下面是sendto()函數和recvfrom()函數的聲明:

#include <sys/types.h>

#include <sys/socket.h>

int sendto(int sockfd, const void *msg, int len, unsigned int flags,

const struct sockaddr *to, int tolen);

和你所看到的同樣,這個函數和send()函數基本一致。

l sockfd 是表明你與遠程程序鏈接的套接字描述符。

l msg 是一個指針,指向你想發送的信息的地址。

l len 是你想發送信息的長度。

l flags 發送標記。通常都設爲0。(你能夠查看send 的man pages 來得到其餘的參

數值而且明白各個參數所表明的含義)

l to 是一個指向struct sockaddr 結構的指針,裏面包含了遠程主機的IP 地址和端口

數據。

l tolen 只是指出了struct sockaddr 在內存中的大小sizeof(struct sockaddr)。

和send()同樣,sendto()返回它所真正發送的字節數(固然也和send()同樣,它所真正

發送的字節數可能小於你所給它的數據的字節數)。當它發生錯誤的時候,也是返回 –1 ,

同時全局變量errno 存儲了錯誤代碼。

一樣的,recv()函數和recvfrom()函數也基本一致。

recvfrom()的聲明爲:

#include <sys/types.h>

- 156 - Linux網絡編程

#include <sys/socket.h>

int recvfrom(int sockfd, void *buf, int len, unsigned int flags

struct sockaddr *from, int *fromlen);

其參數含義以下:

l sockfd 是你要讀取數據的套接字描述符。

l buf 是一個指針,指向你能存儲數據的內存緩存區域。

l len 是緩存區的最大尺寸。

l flags 是recv() 函數的一個標誌,通常都爲0 (具體的其餘數值和含義請參考recv()

的man pages)。

l from 是一個本地指針,指向一個struct sockaddr 的結構(裏面存有源IP 地址和端

口數).

l fromlen 是一個指向一個int 型數據的指針,它的大小應該是sizeof ( struct

sockaddr).當函數返回的時候,formlen 指向的數據是form 指向的struct sockaddr 的實際

大小.

recvfrom() 返回它接收到的字節數,若是發生了錯誤,它就返回-1

close()和shutdown()函數

程序進行網絡傳輸完畢後,你須要關閉這個套接字描述符所表示的鏈接。實現這個非

常簡單,只須要使用標準的關閉文件的函數:close()。

使用方法:

close(sockfd);

執行close()以後,套接字將不會在容許進行讀操做和寫操做。任何有關對套接字描述

符進行讀和寫的操做都會接收到一個錯誤。

若是你想對網絡套接字的關閉進行進一步的操做的話,你可使用函數shutdown()。

它容許你進行單向的關閉操做,或是所有禁止掉。

shutdown()的聲明爲:

#include <sys/socket.h>

int shutdown(int sockfd, int how);

它的參數含義以下:

l sockfd 是一個你所想關閉的套接字描述符.

l how 能夠取下面的值。0 表示不容許之後數據的接收操;1 表示不容許之後數據

的發送操做;2 表示和close()同樣,不容許之後的任何操做(包括接收,發送數據)

shutdown() 若是執行成功將返回0,若是在調用過程當中發生了錯誤,它將返回–1,全

局變量errno 中存儲了錯誤代碼.

若是你在一個未鏈接的數據報套接字上使用shutdown() 函數(還記得能夠對數據報套

接字UDP 進行connect()操做嗎?),它將什麼也不作.

setsockopt() 和getsockopt() 函數

Linux 所提供的socket 庫含有一個錯誤(bug)。此錯誤表現爲你不能爲一個套接字重

新啓用同一個端口號,即便在你正常關閉該套接字之後。例如,比方說,你編寫一個服務

器在一個套接字上等待的程序.服務器打開套接字並在其上偵聽是沒有問題的。不管如何,

總有一些緣由(不論是正常仍是非正常的結束程序)使你的程序須要從新啓動。然而重啓

動後你就不能把它綁定在原來那個端口上了。從bind()系統調用返回的錯誤代碼老是報告

說你試圖鏈接的端口已經被別的進程所綁定。

問題就是Linux 內核在一個綁定套接字的進程結束後從不把端口標記爲未用。在大多

數Linux/UNIX 系統中,端口能夠被一個進程重複使用,甚至能夠被其它進程使用。

在Linux 中繞開這個問題的辦法是,當套接字已經打開但還沒有有鏈接的時候用

setsockopt()系統調用在其上設定選項(options)。setsockopt() 調用設置選項而getsockopt()

從給定的套接字取得選項。

這裏是這些調用的語法:

#include<sys/types.h>

#include<sys/socket.h>

int getsockopt(int sockfd, int level, int name, char *value, int *optlen);

int setsockopt(int sockfd, int level, int name, char *value, int *optlen);

下面是兩個調用的參數說明:

l sockfd 必須是一個已打開的套接字。

l level 是函數所使用的協議標準(protocol level)(TCP/IP 協議使用IPPROTO_TCP,

套接字標準的選項實用SOL_SOCKET)。

l name 選項在套接字說明書中(man page)有詳細說明。

l value 指向爲getsockopt()函數所獲取的值,setsockopt()函數所設置的值的地址。

l optlen 指針指向一個整數,該整數包含參數以字節計算的長度。

如今咱們再回到Linux 的錯誤上來.當你打開一個套接字時必須同時用下面的代碼段

來調用setsockopt()函數:

/* 設定參數數值 */

opt = 1; len = sizeof(opt);

/* 設置套接字屬性 */

setsockopt(sockfd,SOL_SOCKET,SO_REUSEADDR,&opt,&len);

getpeername()函數

這個函數能夠取得一個已經鏈接上的套接字的遠程信息(好比IP 地址和端口),告訴

你在遠程和你鏈接的到底是誰.

它的聲明爲:

#include <sys/socket.h>

int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);

下面是參數說明:

l sockfd 是你想取得遠程信息的那個套接字描述符。

l addr 是一個指向struct sockaddr (或是struct sockaddr_in)的指針。

l addrlen 是一個指向int 的指針,應該賦於sizeof(struct sockaddr)的大小。

若是在函數執行過程當中出現了錯誤,函數將返回 –1 ,而且錯誤代碼儲存在全局變量

errno 中。

當你擁有了遠程鏈接用戶的IP 地址,你就可使用inet_ntoa() 或gethostbyaddr()來輸

出信息或是作進一步的處理。

gethostname()函數

gethostname()函數能夠取得本地主機的信息.它比getpeername()要容易使用一些。

它返回正在執行它的計算機的名字。返回的這個名字能夠被gethostbyname()函數使用,

由此能夠獲得本地主機的IP 地址。

下面是它的聲明:

#include <unistd.h>

int gethostname(char *hostname, size_t size);

參數說明以下:

l hostname 是一個指向字符數組的指針,當函數返回的時候,它裏面的數據就是本

地的主機的名字.

l size 是hostname 指向的數組的長度.

函數若是成功執行,它返回0,若是出現錯誤,則返回–1,全局變量errno 中存儲着錯

誤代碼。

相關文章
相關標籤/搜索