Linux網絡編程入門

網絡程序和普通的程序最大的區別是什麼?

最大的區別是網絡程序是由兩個部分組成的--客戶端和服務器端linux


誰是客戶端

客戶端在網絡程序中,若是一個程序主動和外面的程序通訊,那麼咱們把這個程序稱爲客戶端程序。 好比咱們使用ftp程序從另一個地方獲取文件的時候,是咱們的ftp程序主動同外面進行通訊(獲取文件), 因此這個地方咱們的ftp程序就是客戶端程序。算法


誰是服務端

和客戶端相對應的程序即爲服務端程序。被動的等待外面的程序來和本身通信的程序稱爲服務端程序。好比上面的文件獲取中,另一個地方的程序就是服務端,咱們從服務端獲取文件過來。數據庫


互爲客戶和服務端

實際生活中有些程序是互爲服務和客戶端。在這種狀況項目, 一個程序既爲客戶端也是服務端。編程


經常使用的命令

因爲網絡程序是有兩個部分組成,因此在調試的時候比較麻煩,爲此咱們有必要知道一些經常使用的網絡命令數組


netstat
命令netstat是用來顯示網絡的鏈接,路由表和接口統計等網絡的信息。netstat有許多的選項。咱們經常使用的選項是-na用來顯示詳細的網絡狀態。至於其它的選項咱們可使用幫助手冊得到詳細的狀況。安全


telnet
telnet是一個用來登陸遠程的程序,可是咱們徹底能夠用這個程序來調試咱們的服務端程序的。好比咱們的服務器程序在監聽8888端口,咱們能夠用telnet localhost 8888 來查看服務端的情況。服務器


ping網絡

ping 程序用來判斷網絡的狀態是否正常,最常常的一個用法是ping 192。168。0。1,表示咱們想查看到192。168。0。1的硬件鏈接是否正常數據結構


TCP/UDP介紹

TCP(Transfer Control Protocol)傳輸控制協議是一種面向鏈接的協議, 當咱們的網絡程序使用這個協議的時候,網絡能夠保證咱們的客戶端和服務端的鏈接是可靠的,安全的。多線程


UDP(User Datagram Protocol)用戶數據報協議是一種非面向鏈接的協議,這種協議並不能保證咱們的網絡程序的鏈接是可靠的,因此咱們如今編寫的程序通常是採用TCP協議的。


初等網絡函數(TCP)

Linux系統是經過提供套接字(socket)來進行網絡編程的。網絡程序經過socket和其它幾個函數的調用,會返回一個 通信的文件描述符,咱們能夠將這個描述符當作普通的文件的描述符來操做,這就是linux的設備無關性的好處。
咱們能夠經過向描述符讀寫操做實現網絡之間的數據交流。


socket函數

原型及參數
int socket(int domain, int type,int protocol)

  • domain:說明咱們網絡程序所在的主機採用的通信協族(AF_UNIXAF_INET等)。AF_UNIX只可以用於單一的Unix 系統進程間通訊,而AF_INET是針對Internet的,於是能夠容許在遠程主機之間通訊(當咱們 man socket時發現 domain可選項是 PF_*而不是AF_*,由於glibcposix的實現因此用PF代替了AF,不過咱們均可以使用的)。

  • type:咱們網絡程序所採用的通信協議(SOCK_STREAMSOCK_DGRAM等),SOCK_STREAM代表咱們用的是TCP 協議,這樣會提供按順序的,可靠,雙向,面向鏈接的比特流。SOCK_DGRAM代表咱們用的是UDP協議,這樣只會提供定長的,不可靠,無鏈接的通訊。

  • protocol:因爲咱們指定了type,因此這個地方咱們通常只要用0來代替就能夠了 socket爲網絡通信作基本的準備。成功時返回文件描述符,失敗時返回-1,看errno可知道出錯的詳細狀況。


bind函數

原型及參數
int bind(int sockfd, struct sockaddr *my_addr, int addrlen)

  • sockfd:是由socket調用返回的文件描述符。
  • addrlen:是sockaddr結構的長度。
  • my_addr:是一個指向sockaddr的指針。 在中有 sockaddr的定義
struct sockaddr{
unisgned shortas_family;
char sa_data[14];
};

不過因爲系統的兼容性,咱們通常不用這個頭文件,而使用另一個結構(struct sockaddr_in) 來代替。在中有sockaddr_in的定義

struct sockaddr_in{
    unsigned shortsin_family; 
    unsigned short intsin_port;
    struct in_addrsin_addr;
    unsigned charsin_zero[8];
}
  • sin_family通常爲AF_INET,咱們主要使用Internet。
  • sin_addr設置爲INADDR_ANY表示能夠和任何的主機通訊,
  • sin_port是咱們要監聽的端口號。sin_zero[8]是用來填充的。

bind將本地的端口同socket返回的文件描述符捆綁在一塊兒。成功是返回0,失敗的狀況和socket同樣


listen 函數

listen函數將bind的文件描述符變爲監聽套接字。返回的狀況和bind同樣。

int listen(int sockfd,int backlog)

  • sockfd:是bind後的文件描述符。
  • backlog:設置請求排隊的最大長度。當有多個客戶端程序和服務端相連時, 使用這個表示能夠介紹的排隊長度。

accept函數

函數原型及參數

int accept(int sockfd, struct sockaddr *addr,int *addrlen)

  • sockfd:是listen後的文件描述符。

  • addr,addrlen是用來給客戶端的程序填寫的,服務器端只要傳遞指針就能夠了。 bind,listen和accept是服務器端用的函數


accept調用時,服務器端的程序會一直阻塞到有一個 客戶程序發出了鏈接。 accept成功時返回最後的服務器端的文件描述符,這個時候服務器端能夠向該描述符寫信息了。 失敗時返回-1。


connect函數

函數原型及參數

int connect(int sockfd, struct sockaddr * serv_addr,int addrlen)

  • sockfd:socket返回的文件描述符。
  • serv_addr:儲存了服務器端的鏈接信息。其中sin_add是服務端的地址
  • addrlen:serv_addr的長度

connect函數是客戶端用來同服務端鏈接的。成功時返回0,sockfd是同服務端通信的文件描述符 失敗時返回-1。


網絡程序創建步驟

總的來講網絡程序是由兩個部分組成的--客戶端和服務器端。它們的創建步驟通常是:
服務器端

  • socket-->bind-->listen-->accept

客戶端

  • socket-->connect

服務器和客戶機的信息函數

轉換和網絡方面的信息函數。


字節轉換函數

在網絡上面有着許多類型的機器,這些機器在表示數據的字節順序是不一樣的, 好比i386芯片是低字節在內存地址的低端,高字節在高端,而alpha芯片卻相反。 爲了統一塊兒來,在Linux下面,有專門的字節轉換函數。

unsigned longint htonl(unsigned longint hostlong)
unsigned short int htons(unisgned short int hostshort)
unsigned longint ntohl(unsigned longint netlong)
unsigned short int ntohs(unsigned short int netshort)

在這四個轉換函數中,h 表明host, n 表明 network。s 表明short, l 表明long。
第一個函數的意義是將本機器上的long數據轉化爲網絡上的long。 其餘幾個函數的意義也差很少。


IP和域名的轉換

在網絡上標誌一臺機器能夠用IP或者是用域名。那麼咱們怎麼去進行轉換呢?

struct hostent *gethostbyname(const char *hostname)
struct hostent *gethostbyaddr(const char *addr,int len,int type)

struct hostent的定義

struct hostent{
char *h_name;/* 主機的正式名稱*/
char *h_aliases;/* 主機的別名 */
inth_addrtype; /* 主機的地址類型AF_INET*/
inth_length; /* 主機的地址長度對於IP4 是4字節32位*/
char **h_addr_list;/* 主機的IP地址列表 */
}

#define h_addr h_addr_list[0]/* 主機的第一個IP地址*/


gethostbyname能夠將機器名(如 linux.yessun.com)轉換爲一個結構指針。在這個結構裏面儲存了域名的信息
gethostbyaddr能夠將一個32位的IP地址(C0A80001)轉換爲結構指針。
這兩個函數失敗時返回NULL 且設置h_errno錯誤變量,調用h_strerror()能夠獲得詳細的出錯信息


字符串的IP和32位的IP轉換。

在網絡上面咱們用的IP都是數字加點(192.168.0.1)構成的, 而在struct in_addr結構中用的是32位的IP,咱們上面那個32位IP(C0A80001)是的192.168.0.1 爲了轉換咱們可使用下面兩個函數

int inet_aton(const char *cp,struct in_addr *inp)
char *inet_ntoa(struct in_addr in)

函數裏面 a 表明 ascii, n 表明network。第一個函數表示將a.b.c.d的IP轉換爲32位的IP,存儲在 inp指針裏面。第二個是將32位IP轉換爲a。b。c。d的格式。


服務信息函數

在網絡程序裏面咱們有時候須要知道端口。IP和服務信息。這個時候咱們可使用如下幾個函數

int getsockname(int sockfd,struct sockaddr *localaddr,int *addrlen)
int getpeername(int sockfd,struct sockaddr *peeraddr, int *addrlen)
struct servent *getservbyname(const char *servname,const char *protoname)
struct servent *getservbyport(int port,const char *protoname)
struct servent
{
    char *s_name;/* 正式服務名 */
    char **s_aliases;/* 別名列表 */ 
    int s_port; /* 端口號 */
    char *s_proto; /* 使用的協議 */
}

通常咱們不多用這幾個函數。對應客戶端,當咱們要獲得鏈接的端口號時在connect調用成功後使用可獲得系統分配的端口號。對於服務端,咱們用INADDR_ANY填充後,爲了獲得鏈接的IP咱們能夠在accept調用成功後 使用而獲得IP地址。在網絡上有許多的默認端口和服務,好比端口21對ftp80對應WWW。爲了獲得指定的端口號的服務 咱們能夠調用第四個函數,相反爲了獲得端口號能夠調用第三個函數。


完整的讀寫函數

一旦咱們創建了鏈接,咱們的下一步就是進行通訊了。在Linux下面把咱們前面創建的通道當作是文件描述符,
這樣服務器端和客戶端進行通訊時候,只要往文件描述符裏面讀寫東西了。 就象咱們往文件讀寫同樣。


寫函數write

ssize_t write(int fd,const void *buf,size_t nbytes)

write函數將buf中的nbytes字節內容寫入文件描述符fd。成功時返回寫的字節數。失敗時返回-1。 並設置errno變量。


在網絡程序中,當咱們向套接字文件描述符寫時有兩種可能。

  • write的返回值大於0,表示寫了部分或者是所有的數據。
  • 返回的值小於0,此時出現了錯誤。咱們要根據錯誤類型來處理。
    -- 若是錯誤爲EINTR表示在寫的時候出現了中斷錯誤。
    -- 若是爲EPIPE表示網絡鏈接出現了問題(對方已經關閉了鏈接)。

讀函數read

ssize_t read(int fd,void *buf,size_t nbyte), read函數是負責從fd中讀取內容。當讀成功時,read返回實際所讀的字節數,若是返回的值是0 表示已經讀到文件的結束了,小於0表示出現了錯誤。

  • 若是錯誤爲EINTR說明讀是由中斷引發的,
  • 若是是ECONNREST表示網絡鏈接出了問題。

數據的傳遞

有了上面的兩個函數,咱們就能夠向客戶端或者是服務端傳遞數據了。好比咱們要傳遞一個結構。可使用以下方式

/*客戶端向服務端寫 */
struct my_struct my_struct_client;
write(fd,(void *)&my_struct_client,sizeof(struct my_struct);
/* 服務端的讀*/
char buffer[sizeof(struct my_struct)];
struct *my_struct_server;
read(fd,(void *)buffer,sizeof(struct my_struct));
my_struct_server=(struct my_struct *)buffer;

在網絡上傳遞數據時咱們通常都是把數據轉化爲char類型的數據傳遞。接收的時候也是同樣的 注意的是咱們沒有必要在網絡上傳遞指針(由於傳遞指針是沒有任何意義的,咱們必須傳遞指針所指向的內容)


用戶數據報發送(UDP)

咱們前面已經學習網絡程序的一個很大的部分,由這個部分的知識,咱們實際上能夠寫出大部分的基於TCP協議的網絡程序了。如今在 Linux下的大部分程序都是用咱們上面所學的知識來寫的。咱們能夠去找一些源程序來參考一下。


recvfrom和sendto函數

int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr * from int *fromlen)
int sendto(int sockfd,const void *msg,int len,unsigned int flags,struct sockaddr *to int tolen)

sockfd,buf,len的意義和read,write同樣,分別表示套接字描述符,發送或接收的緩衝區及大小。


recvfrom負責從sockfd接收數據,若是from不是NULL,那麼在from裏面存儲了信息來源的狀況,若是對信息的來源不感興趣,能夠將from和fromlen設置爲NULL。sendto負責向to發送信息。此時在to裏面存儲了收信息方的詳細資料。


高級套接字函數

在前面的幾個部分裏面,咱們已經學會了怎麼樣從網絡上讀寫信息了。前面的一些函數(read,write)是網絡程序裏面最基本的函數。也是最原始的通訊函數。在這一章裏面,咱們一塊兒來學習網絡通訊的高級函數。這一章咱們學習另外幾個讀寫函數。


recv和send函數

recv和send函數提供了和read和write差很少的功能。不過它們提供 了第四個參數來控制讀寫操做。

int recv(int sockfd,void *buf,int len,int flags)
int send(int sockfd,void *buf,int len,int flags)

前面的三個參數和read,write同樣,第四個參數能夠是0或者是如下的組合

  • MSG_DONTROUTE:不查找路由表
  • MSG_OOB:接受或者發送帶外數據
  • MSG_PEEK:查看數據,並不從系統緩衝區移走數據
  • MSG_WAITALL:等待全部數據
  • MSG_DONTROUTE:是send函數使用的標誌。這個標誌告訴IP協議。目的主機在本地網絡上面,沒有必要查找路由表。這個標誌通常用網絡診斷和路由程序裏面。
  • MSG_OOB:表示能夠接收和發送帶外的數據。關於帶外數據咱們之後會解釋的。
  • MSG_PEEK:是recv函數的使用標誌,表示只是從系統緩衝區中讀取內容,而不清除系統緩衝區的內容。這樣下次讀的時候,仍然是同樣的內容。通常在有多個進程讀寫數據時可使用這個標誌。
  • MSG_WAITALL是recv函數的使用標誌,表示等到全部的信息到達時才返回。使用這個標誌的時候recv回一直阻塞,直到指定的條件知足,或者是發生了錯誤。

  • 當讀到了指定的字節時,函數正常返回。返回值等於len
  • 當讀到了文件的結尾時,函數正常返回。返回值小於len
  • 當操做發生錯誤時,返回-1,且設置錯誤爲相應的錯誤號(errno)

若是flags爲0,則和read,write同樣的操做。還有其它的幾個選項,不過咱們實際上用的不多


recvfrom和sendto

這兩個函數通常用在非套接字的網絡程序當中(UDP),咱們已經在前面學會了。


recvmsg和sendmsg 函數

recvmsg和sendmsg能夠實現前面全部的讀寫函數的功能。

int recvmsg(int sockfd,struct msghdr *msg,int flags)
int sendmsg(int sockfd,struct msghdr *msg,int flags)
struct msghdr
{
    void *msg_name;
    int msg_namelen;
    struct iovec *msg_iov;
    int msg_iovlen;
    void *msg_control;
    int msg_controllen;
    int msg_flags;
}
struct iovec
{
    void *iov_base; /* 緩衝區開始的地址*/
    size_t iov_len; /* 緩衝區的長度*/
}
  • msg_namemsg_namelen當套接字是非面向鏈接時(UDP),它們存儲接收和發送方的地址信息。
  • msg_name其實是一個指向struct sockaddr的指針,
  • msg_namelen是結構的長度。當套接字是面向鏈接時,這兩個值應設爲NULL
  • msg_iovmsg_iovlen指出接受和發送的緩衝區內容。msg_iov是一個結構指針,msg_iovlen指出這個結構數組的大小。
  • msg_controlmsg_controllen這兩個變量是用來接收和發送控制數據時的 msg_flags指定接受和發送的操做選項和 recv,send的選項同樣

套接字的關閉

關閉套接字有兩個函數close和shutdown。用close時和咱們關閉文件同樣。


shutdown函數

int shutdown(int sockfd,int howto)

TCP鏈接是雙向的(是可讀寫的),當咱們使用close時,會把讀寫通道都關閉,有時侯咱們但願只關閉一個方向,這個時候咱們可使用shutdown。針對不一樣的howto,系統回採起不一樣的關閉方式。
howto=0這個時候系統會關閉讀通道。可是能夠繼續往接字描述符寫。
howto=1關閉寫通道,和上面相反,着時候就只能夠讀了。
howto=2關閉讀寫通道,和close同樣 在多進程程序裏面,若是有幾個子進程共享一個套接字時,若是咱們使用shutdown,那麼全部的子進程都不可以操做了,這個時候咱們只可以使用close來關閉子進程的套接字描述符。


TCP/IP協議


網絡傳輸分層

若是你考過計算機等級考試,那麼你就應該已經知道了網絡傳輸分層這個概念。在網絡上,人們爲了傳輸數據時的方便,把網絡的傳輸分爲7個層次。分別是:應用層,表示層,會話層,傳輸層,網絡層,數據鏈路層和物理層。分好了層之後,傳輸數據時,上一層若是要數據的話,就能夠直接向下一層要了,而沒必要要管數據傳輸的細節。下一層也只向它的上一層提供數據, 而不要去管其它東西了。若是你不想考試,你沒有必要去記這些東西的。只要知道是分層的,並且各層的做用不一樣。


IP協議

IP協議是在網絡層的協議。它主要完成數據包的發送做用。 詳細描述略


ICMP協議

ICMP是消息控制協議,也處於網絡層。在網絡上傳遞IP數據包時,若是發生了錯誤,那麼就會用ICMP協議來報告錯誤。關於ICMP協議的詳細狀況能夠查看 RFC792


UDP協議

UDP協議是創建在IP協議基礎之上的,用在傳輸層的協議。UDP和IP協議同樣是不可靠的數據報服務。


TCP

TCP協議也是創建在IP協議之上的,不過TCP協議是可靠的。按照順序發送的。TCP的數據結構比前面的結構都要複雜。

關於TCP的報文內容請參考這裏


套接字選項

有時候咱們要控制套接字的行爲(如修改緩衝區的大小),這個時候咱們就要控制套接字的選項了。


getsockopt和setsockopt函數

int getsockopt(int sockfd,int level,int optname,void *optval,socklen_t *optlen)
int setsockopt(int sockfd,int level,int optname,const void *optval,socklen_t *optlen)
  • level指定控制套接字的層次。能夠取三種值:

-- SOL_SOCKET:通用套接字選項。
-- IPPROTO_IP:IP選項。
-- IPPROTO_TCP:TCP選項。

  • optname指定控制的方式(選項的名稱),咱們下面詳細解釋optval得到或者是設置套接字選項。根據選項名稱的數據類型進行轉換

套接字選項名稱及類型

SO_BROADCAST 容許發送廣播數據int
SO_DEBUG容許調試int
SO_DONTROUTE 不查找路由int
SO_ERROR得到套接字錯誤int
SO_KEEPALIVE 保持鏈接int
SO_LINGER 延遲關閉鏈接 struct linger
SO_OOBINLINE 帶外數據放入正常數據流int
SO_RCVBUF 接收緩衝區大小int
SO_SNDBUF 發送緩衝區大小int
SO_RCVLOWAT接收緩衝區下限int
SO_SNDLOWAT發送緩衝區下限int
SO_RCVTIMEO接收超時struct timeval
SO_SNDTIMEO發送超時struct timeval
SO_REUSERADDR容許重用本地地址和端口int
SO_TYPE 得到套接字類型int
SO_BSDCOMPAT 與BSD系統兼容int


IP(IPPROTO_IP)選項

IP_HDRINCL在數據包中包含IP首部 int
IP_OPTINOSIP首部選項int
IP_TOS服務類型
IP_TTL生存時間int


TCP選項

TCP_MAXSEGTCP最大數據段的大小int
TCP_NODELAY不使用Nagle算法 int


ioctl函數

ioctl能夠控制全部的文件描述符的狀況,這裏介紹一下控制套接字的選項。

int ioctl(int fd,int req, ...)

ioctl的控制選項

SIOCATMARK是否到達帶外標記int
FIOASYNC異步輸入/輸出標誌 int
FIONREAD緩衝區可讀的字節數int


總結

原始套接字和通常的套接字不一樣的是之前許多由系統作的事情,如今要由咱們本身來作了。 不過這裏面是否是有不少的樂趣呢。當咱們建立了一個 TCP套接字的時候,咱們只是負責把咱們要發送的內容(buffer)傳遞給了系統。 系統在收到咱們的數據後,會自動的調用相應的模塊給數據加上TCP 頭部,而後加上IP頭部。 再發送出去。而如今是咱們本身建立各個的頭部,系統只是把它們發送出去。 在上面的實例中,因爲咱們要修改咱們的源IP地址, 因此咱們使用了setsockopt函數,若是咱們只是修改TCP數據,那麼IP數據同樣也能夠由系統來建立的。


後記

總算完成了網絡編程這個教程。算起來我差很少寫了一個星期,原來覺得寫這個應該是一件不難的事,作起來才知道原來有不少的地方都比我想象的要難。我還把不少的東西都省略掉了不過寫完了這篇教程之後,我好象對網絡的認識又增長了一步。若是咱們只是編寫通常的網絡程序仍是比較容易的,可是若是咱們想寫出比較好的網絡程序咱們還有着遙遠的路要走。


網絡程序通常的來講都是多進程加上多線程的。爲了處理好他們內部的關係,咱們還要學習進程之間的通訊。在網絡程序裏面有着許許多多的突發事件,爲此咱們還要去學習更高級的 事件處理知識。如今的信息愈來愈多了,爲了處理好這些信息,咱們還要去學習數據庫。


若是要編寫出有用的黑客軟件,咱們還要去熟悉各類網絡協議。總之咱們要學的東西還不少不少。看一看外國的軟件水平,看一看印度的軟件水平,寶島臺灣的水平,再看一看咱們本身的 軟件水平你們就會知道了什麼叫作差距。


咱們如今用的軟件有幾個是咱們中國人本身編寫的。不過你們不要懼怕,不用擔憂。只要咱們仍是清醒的,還可以認清咱們和別人的差距, 咱們就還有但願。 畢竟咱們如今還年輕。只要咱們努力,認真的去學習,咱們必定可以學好的。咱們就能夠追上別人直到超過別人!


相信一點: 別人能夠作到的咱們同樣能夠作到,並且能夠比別人作的更好! 勇敢的年輕人,爲了咱們偉大祖國的軟件產業,爲了祖國的將來,努力的去奮鬥吧!祖國會記住大家的!

相關文章
相關標籤/搜索