Linux I/O複用中select poll epoll模型的介紹及其優缺點的比較

時間 2019-11-17

標籤 linux select poll epoll 模型介紹及其優缺點比較欄目 Linux 简体版

原文原文鏈接

關於I/O多路複用：

I/O多路複用(又被稱爲「事件驅動」)，首先要理解的是，操做系統爲你提供了一個功能，當你的某個socket可讀或者可寫的時候，它能夠給你一個通知。這樣當配合非阻塞的socket使用時，只有當系統通知我哪一個描述符可讀了，我纔去執行read操做，能夠保證每次read都能讀到有效數據而不作純返回-1和EAGAIN的無用功。寫操做相似。操做系統的這個功能經過select/poll/epoll之類的系統調用來實現，這些函數均可以同時監視多個描述符的讀寫就緒情況，這樣，**多個描述符的I/O操做都能在一個線程內併發交替地順序完成，這就叫I/O多路複用，這裏的「複用」指的是複用同一個線程。編程

1、I/O複用之select

一、介紹：
select系統調用的目的是：在一段指定時間內，監聽用戶感興趣的文件描述符上的可讀、可寫和異常事件。poll和select應該被歸類爲這樣的系統調用，它們能夠阻塞地同時探測一組支持非阻塞的IO設備，直至某一個設備觸發了事件或者超過了指定的等待時間——也就是說它們的職責不是作IO，而是幫助調用者尋找當前就緒的設備。
下面是select的原理圖：
數組

二、select系統調用API以下：安全

#include <sys/time.h>
#include <sys/types.h>
#include <unistd.h>
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

fd_set結構體是文件描述符集，該結構體其實是一個整型數組，數組中的每一個元素的每一位標記一個文件描述符。fd_set能容納的文件描述符數量由FD_SETSIZE指定，通常狀況下，FD_SETSIZE等於1024，這就限制了select能同時處理的文件描述符的總量。網絡

三、下面介紹一下各個參數的含義：
1）nfds參數指定被監聽的文件描述符的總數。一般被設置爲select監聽的全部文件描述符中最大值加1；
2）readfds、writefds、exceptfds分別指向可讀、可寫和異常等事件對應的文件描述符集合。這三個參數都是傳入傳出型參數，指的是在調用select以前，用戶把關心的可讀、可寫、或異常的文件描述符經過FD_SET（下面介紹）函數分別添加進readfds、writefds、exceptfds文件描述符集，select將對這些文件描述符集中的文件描述符進行監聽，若是有就緒文件描述符，select會重置readfds、writefds、exceptfds文件描述符集來通知應用程序哪些文件描述符就緒。這個特性將致使select函數返回後，再次調用select以前，必須重置咱們關心的文件描述符，也就是三個文件描述符集已經不是咱們以前傳入的了。
3）timeout參數用來指定select函數的超時時間（下面講select返回值時還會談及）。併發

struct timeval
{
    long tv_sec;        //秒數
    long tv_usec;       //微秒數
};

四、下面幾個函數（宏實現）用來操縱文件描述符集：socket

void FD_SET(int fd, fd_set *set);   //在set中設置文件描述符fd
void FD_CLR(int fd, fd_set *set);   //清除set中的fd位
int  FD_ISSET(int fd, fd_set *set); //判斷set中是否設置了文件描述符fd
void FD_ZERO(fd_set *set);          //清空set中的全部位（在使用文件描述符集前，應該先清空一下）
    //（注意FD_CLR和FD_ZERO的區別，一個是清除某一位，一個是清除全部位）

五、select的返回狀況：
1）若是指定timeout爲NULL，select會永遠等待下去，直到有一個文件描述符就緒，select返回；
2）若是timeout的指定時間爲0，select根本不等待，當即返回；
3）若是指定一段固定時間，則在這一段時間內，若是有指定的文件描述符就緒，select函數返回，若是超過指定時間，select一樣返回。
4）返回值狀況：
a)超時時間內，若是文件描述符就緒，select返回就緒的文件描述符總數（包括可讀、可寫和異常），若是沒有文件描述符就緒，select返回0；
b)select調用失敗時，返回 -1並設置errno，若是收到信號，select返回 -1並設置errno爲EINTR。函數

六、文件描述符的就緒條件：
在網絡編程中，
1）下列狀況下socket可讀：
a) socket內核接收緩衝區的字節數大於或等於其低水位標記SO_RCVLOWAT；
b) socket通訊的對方關閉鏈接，此時該socket可讀，可是一旦讀該socket，會當即返回0（能夠用這個方法判斷client端是否斷開鏈接）；
c) 監聽socket上有新的鏈接請求；
d) socket上有未處理的錯誤。
2）下列狀況下socket可寫：
a) socket內核發送緩衝區的可用字節數大於或等於其低水位標記SO_SNDLOWAT；
b) socket的讀端關閉，此時該socket可寫，一旦對該socket進行操做，該進程會收到SIGPIPE信號；
c) socket使用connect鏈接成功以後；
d) socket上有未處理的錯誤。性能

2、I/O複用之poll

一、poll系統調用的原理與原型和select基本相似，也是在指定時間內輪詢必定數量的文件描述符，以測試其中是否有就緒者。測試

二、poll系統調用API以下：ui

#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);

三、下面介紹一下各個參數的含義：
1）第一個參數是指向一個結構數組的第一個元素的指針，每一個元素都是一個pollfd結構，用於指定測試某個給定描述符的條件。

struct pollfd
{
    int fd;             //指定要監聽的文件描述符
    short events;       //指定監聽fd上的什麼事件
    short revents;      //fd上事件就緒後，用於保存實際發生的時間
}；

待監聽的事件由events成員指定，函數在相應的revents成員中返回該描述符的狀態（每一個文件描述符都有兩個事件，一個是傳入型的events，一個是傳出型的revents，從而避免使用傳入傳出型參數，注意與select的區別），從而告知應用程序fd上實際發生了哪些事件。events和revents均可以是多個事件的按位或。
2）第二個參數是要監聽的文件描述符的個數，也就是數組fds的元素個數；
3）第三個參數意義與select相同。

四、poll的事件類型：

在使用POLLRDHUP時，要在代碼開始處定義_GNU_SOURCE

五、poll的返回狀況：
與select相同。

3、I/O複用之epoll

一、介紹：
epoll 與select和poll在使用和實現上有很大區別。首先，epoll使用一組函數來完成，而不是單獨的一個函數；其次，epoll把用戶關心的文件描述符上的事件放在內核裏的一個事件表中，無須向select和poll那樣每次調用都要重複傳入文件描述符集合事件集。

二、建立一個文件描述符，指定內核中的事件表：

#include<sys/epoll.h>
int epoll_create(int size);
    //調用成功返回一個文件描述符，失敗返回-1並設置errno。

size參數並不起做用，只是給內核一個提示，告訴它事件表須要多大。該函數返回的文件描述符指定要訪問的內核事件表，是其餘全部epoll系統調用的句柄。

三、操做內核事件表：

#include<sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
    //調用成功返回0，調用失敗返回-1並設置errno。

epfd是epoll_create返回的文件句柄，標識事件表，op指定操做類型。操做類型有如下3種：

a）EPOLL_CTL_ADD， 往事件表中註冊fd上的事件；
b）EPOLL_CTL_MOD， 修改fd上註冊的事件；
c）EPOLL_CTL_DEL， 刪除fd上註冊的事件。

event參數指定事件，epoll_event的定義以下：

struct epoll_event
{
    __int32_t events;       //epoll事件
    epoll_data_t data;      //用戶數據
};

typedef union epoll_data
{
    void *ptr;
    int  fd;
    uint32_t u32;
    uint64_t u64;
}epoll_data;

在使用epoll_ctl時，是把fd添加、修改到內核事件表中，或從內核事件表中刪除fd的事件。若是是添加事件到事件表中，能夠往data中的fd上添加事件events，或者不用data中的fd，而把fd放到用戶數據ptr所指的內存中（由於epoll_data是一個聯合體，只能使用其中一個數據）,再設置events。

三、epoll_wait函數
epoll系統調用的最關鍵的一個函數epoll_wait，它在一段時間內等待一個組文件描述符上的事件。

#include<sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
    //函數調用成功返回就緒文件描述符個數，失敗返回-1並設置errno。

timeout參數和select與poll相同，指定一個超時時間；maxevents指定最多監聽多少個事件；events是一個傳出型參數，epoll_wait函數若是檢測到事件就緒，就將全部就緒的事件從內核事件表（epfd所指的文件）中複製到events指定的數組中。這個數組用來輸出epoll_wait檢測到的就緒事件，而不像select與poll那樣，這也是epoll與前者最大的區別，下文在比較三者之間的區別時還會說到。

4、三組I/O複用函數的比較

相同點：
1）三者都須要在fd上註冊用戶關心的事件；
2）三者都要一個timeout參數指定超時時間；
不一樣點：
1）select：
a）select指定三個文件描述符集，分別是可讀、可寫和異常事件，因此不能更加細緻地區分全部可能發生的事件；
b）select若是檢測到就緒事件，會在原來的文件描述符上改動，以告知應用程序，文件描述符上發生了什麼時間，因此再次調用select時，必須先重置文件描述符；
c）select採用對全部註冊的文件描述符集輪詢的方式，會返回整個用戶註冊的事件集合，因此應用程序索引就緒文件的時間複雜度爲O(n)；
d）select容許監聽的最大文件描述符個數一般有限制，通常是1024，若是大於1024，select的性能會急劇降低；
e）只能工做在LT模式。

2）poll：
a）poll把文件描述符和事件綁定，事件不但能夠單獨指定，並且能夠是多個事件的按位或，這樣更加細化了事件的註冊，並且poll單獨採用一個元素用來保存就緒返回時的結果，這樣在下次調用poll時，就不用重置以前註冊的事件；
b）poll採用對全部註冊的文件描述符集輪詢的方式，會返回整個用戶註冊的事件集合，因此應用程序索引就緒文件的時間複雜度爲O(n)。
c）poll用nfds參數指定最多監聽多少個文件描述符和事件，這個數能達到系統容許打開的最大文件描述符數目，即65535。
d）只能工做在LT模式。

3）epoll：
a）epoll把用戶註冊的文件描述符和事件放到內核當中的事件表中，提供了一個獨立的系統調用epoll_ctl來管理用戶的事件，並且epoll採用回調的方式，一旦有註冊的文件描述符就緒，講觸發回調函數，該回調函數將就緒的文件描述符和事件拷貝到用戶空間events所管理的內存，這樣應用程序索引就緒文件的時間複雜度達到O(1)。
b）epoll_wait使用maxevents來制定最多監聽多少個文件描述符和事件，這個數能達到系統容許打開的最大文件描述符數目，即65535；
c）不只能工做在LT模式，並且還支持ET高效模式（即EPOLLONESHOT事件，讀者能夠本身查一下這個事件類型，對於epoll的線程安全有很好的幫助）。

select/poll/epoll總結：