I/O多路複用(又被稱爲「事件驅動」),首先要理解的是,操做系統爲你提供了一個功能,當你的某個socket可讀或者可寫的時候,它能夠給你一個通知。這樣當配合非阻塞的socket使用時,只有當系統通知我哪一個描述符可讀了,我纔去執行read操做,能夠保證每次read都能讀到有效數據而不作純返回-1和EAGAIN的無用功。寫操做相似。操做系統的這個功能經過select/poll/epoll之類的系統調用來實現,這些函數均可以同時監視多個描述符的讀寫就緒情況,這樣,**多個描述符的I/O操做都能在一個線程內併發交替地順序完成,這就叫I/O多路複用,這裏的「複用」指的是複用同一個線程。編程
一、介紹:
select系統調用的目的是:在一段指定時間內,監聽用戶感興趣的文件描述符上的可讀、可寫和異常事件。poll和select應該被歸類爲這樣的系統調用,它們能夠阻塞地同時探測一組支持非阻塞的IO設備,直至某一個設備觸發了事件或者超過了指定的等待時間——也就是說它們的職責不是作IO,而是幫助調用者尋找當前就緒的設備。
下面是select的原理圖:
數組
二、select系統調用API以下:安全
#include <sys/time.h> #include <sys/types.h> #include <unistd.h> int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
fd_set結構體是文件描述符集,該結構體其實是一個整型數組,數組中的每一個元素的每一位標記一個文件描述符。fd_set能容納的文件描述符數量由FD_SETSIZE指定,通常狀況下,FD_SETSIZE等於1024,這就限制了select能同時處理的文件描述符的總量。網絡
三、下面介紹一下各個參數的含義:
1)nfds參數指定被監聽的文件描述符的總數。一般被設置爲select監聽的全部文件描述符中最大值加1;
2)readfds、writefds、exceptfds分別指向可讀、可寫和異常等事件對應的文件描述符集合。這三個參數都是傳入傳出型參數,指的是在調用select以前,用戶把關心的可讀、可寫、或異常的文件描述符經過FD_SET(下面介紹)函數分別添加進readfds、writefds、exceptfds文件描述符集,select將對這些文件描述符集中的文件描述符進行監聽,若是有就緒文件描述符,select會重置readfds、writefds、exceptfds文件描述符集來通知應用程序哪些文件描述符就緒。這個特性將致使select函數返回後,再次調用select以前,必須重置咱們關心的文件描述符,也就是三個文件描述符集已經不是咱們以前傳入 的了。
3)timeout參數用來指定select函數的超時時間(下面講select返回值時還會談及)。併發
struct timeval { long tv_sec; //秒數 long tv_usec; //微秒數 };
四、下面幾個函數(宏實現)用來操縱文件描述符集:socket
void FD_SET(int fd, fd_set *set); //在set中設置文件描述符fd void FD_CLR(int fd, fd_set *set); //清除set中的fd位 int FD_ISSET(int fd, fd_set *set); //判斷set中是否設置了文件描述符fd void FD_ZERO(fd_set *set); //清空set中的全部位(在使用文件描述符集前,應該先清空一下) //(注意FD_CLR和FD_ZERO的區別,一個是清除某一位,一個是清除全部位)
五、select的返回狀況:
1)若是指定timeout爲NULL,select會永遠等待下去,直到有一個文件描述符就緒,select返回;
2)若是timeout的指定時間爲0,select根本不等待,當即返回;
3)若是指定一段固定時間,則在這一段時間內,若是有指定的文件描述符就緒,select函數返回,若是超過指定時間,select一樣返回。
4)返回值狀況:
a)超時時間內,若是文件描述符就緒,select返回就緒的文件描述符總數(包括可讀、可寫和異常),若是沒有文件描述符就緒,select返回0;
b)select調用失敗時,返回 -1並設置errno,若是收到信號,select返回 -1並設置errno爲EINTR。函數
六、文件描述符的就緒條件:
在網絡編程中,
1)下列狀況下socket可讀:
a) socket內核接收緩衝區的字節數大於或等於其低水位標記SO_RCVLOWAT;
b) socket通訊的對方關閉鏈接,此時該socket可讀,可是一旦讀該socket,會當即返回0(能夠用這個方法判斷client端是否斷開鏈接);
c) 監聽socket上有新的鏈接請求;
d) socket上有未處理的錯誤。
2)下列狀況下socket可寫:
a) socket內核發送緩衝區的可用字節數大於或等於其低水位標記SO_SNDLOWAT;
b) socket的讀端關閉,此時該socket可寫,一旦對該socket進行操做,該進程會收到SIGPIPE信號;
c) socket使用connect鏈接成功以後;
d) socket上有未處理的錯誤。性能
一、poll系統調用的原理與原型和select基本相似,也是在指定時間內輪詢必定數量的文件描述符,以測試其中是否有就緒者。測試
二、poll系統調用API以下:ui
#include <poll.h> int poll(struct pollfd *fds, nfds_t nfds, int timeout);
三、下面介紹一下各個參數的含義:
1)第一個參數是指向一個結構數組的第一個元素的指針,每一個元素都是一個pollfd結構,用於指定測試某個給定描述符的條件。
struct pollfd { int fd; //指定要監聽的文件描述符 short events; //指定監聽fd上的什麼事件 short revents; //fd上事件就緒後,用於保存實際發生的時間 };
待監聽的事件由events成員指定,函數在相應的revents成員中返回該描述符的狀態(每一個文件描述符都有兩個事件,一個是傳入型的events,一個是傳出型的revents,從而避免使用傳入傳出型參數,注意與select的區別),從而告知應用程序fd上實際發生了哪些事件。events和revents均可以是多個事件的按位或。
2)第二個參數是要監聽的文件描述符的個數,也就是數組fds的元素個數;
3)第三個參數意義與select相同。
四、poll的事件類型:
在使用POLLRDHUP時,要在代碼開始處定義_GNU_SOURCE
五、poll的返回狀況:
與select相同。
一、介紹:
epoll 與select和poll在使用和實現上有很大區別。首先,epoll使用一組函數來完成,而不是單獨的一個函數;其次,epoll把用戶關心的文件描述符上的事件放在內核裏的一個事件表中,無須向select和poll那樣每次調用都要重複傳入文件描述符集合事件集。
二、建立一個文件描述符,指定內核中的事件表:
#include<sys/epoll.h> int epoll_create(int size); //調用成功返回一個文件描述符,失敗返回-1並設置errno。
size參數並不起做用,只是給內核一個提示,告訴它事件表須要多大。該函數返回的文件描述符指定要訪問的內核事件表,是其餘全部epoll系統調用的句柄。
三、操做內核事件表:
#include<sys/epoll.h> int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); //調用成功返回0,調用失敗返回-1並設置errno。
epfd是epoll_create返回的文件句柄,標識事件表,op指定操做類型。操做類型有如下3種:
a)EPOLL_CTL_ADD, 往事件表中註冊fd上的事件; b)EPOLL_CTL_MOD, 修改fd上註冊的事件; c)EPOLL_CTL_DEL, 刪除fd上註冊的事件。
event參數指定事件,epoll_event的定義以下:
struct epoll_event { __int32_t events; //epoll事件 epoll_data_t data; //用戶數據 }; typedef union epoll_data { void *ptr; int fd; uint32_t u32; uint64_t u64; }epoll_data;
在使用epoll_ctl時,是把fd添加、修改到內核事件表中,或從內核事件表中刪除fd的事件。若是是添加事件到事件表中,能夠往data中的fd上添加事件events,或者不用data中的fd,而把fd放到用戶數據ptr所指的內存中(由於epoll_data是一個聯合體,只能使用其中一個數據),再設置events。
三、epoll_wait函數
epoll系統調用的最關鍵的一個函數epoll_wait,它在一段時間內等待一個組文件描述符上的事件。
#include<sys/epoll.h> int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout); //函數調用成功返回就緒文件描述符個數,失敗返回-1並設置errno。
timeout參數和select與poll相同,指定一個超時時間;maxevents指定最多監聽多少個事件;events是一個傳出型參數,epoll_wait函數若是檢測到事件就緒,就將全部就緒的事件從內核事件表(epfd所指的文件)中複製到events指定的數組中。這個數組用來輸出epoll_wait檢測到的就緒事件,而不像select與poll那樣,這也是epoll與前者最大的區別,下文在比較三者之間的區別時還會說到。
相同點:
1)三者都須要在fd上註冊用戶關心的事件;
2)三者都要一個timeout參數指定超時時間;
不一樣點:
1)select:
a)select指定三個文件描述符集,分別是可讀、可寫和異常事件,因此不能更加細緻地區分全部可能發生的事件;
b)select若是檢測到就緒事件,會在原來的文件描述符上改動,以告知應用程序,文件描述符上發生了什麼時間,因此再次調用select時,必須先重置文件描述符;
c)select採用對全部註冊的文件描述符集輪詢的方式,會返回整個用戶註冊的事件集合,因此應用程序索引就緒文件的時間複雜度爲O(n);
d)select容許監聽的最大文件描述符個數一般有限制,通常是1024,若是大於1024,select的性能會急劇降低;
e)只能工做在LT模式。
2)poll:
a)poll把文件描述符和事件綁定,事件不但能夠單獨指定,並且能夠是多個事件的按位或,這樣更加細化了事件的註冊,並且poll單獨採用一個元素用來保存就緒返回時的結果,這樣在下次調用poll時,就不用重置以前註冊的事件;
b)poll採用對全部註冊的文件描述符集輪詢的方式,會返回整個用戶註冊的事件集合,因此應用程序索引就緒文件的時間複雜度爲O(n)。
c)poll用nfds參數指定最多監聽多少個文件描述符和事件,這個數能達到系統容許打開的最大文件描述符數目,即65535。
d)只能工做在LT模式。
3)epoll:
a)epoll把用戶註冊的文件描述符和事件放到內核當中的事件表中,提供了一個獨立的系統調用epoll_ctl來管理用戶的事件,並且epoll採用回調的方式,一旦有註冊的文件描述符就緒,講觸發回調函數,該回調函數將就緒的文件描述符和事件拷貝到用戶空間events所管理的內存,這樣應用程序索引就緒文件的時間複雜度達到O(1)。
b)epoll_wait使用maxevents來制定最多監聽多少個文件描述符和事件,這個數能達到系統容許打開的最大文件描述符數目,即65535;
c)不只能工做在LT模式,並且還支持ET高效模式(即EPOLLONESHOT事件,讀者能夠本身查一下這個事件類型,對於epoll的線程安全有很好的幫助)。
select/poll/epoll總結: