Linux I/O複用中select poll epoll模型的介紹及其優缺點的比較

關於I/O多路複用:

I/O多路複用(又被稱爲「事件驅動」),首先要理解的是,操做系統爲你提供了一個功能,當你的某個socket可讀或者可寫的時候,它能夠給你一個通知。這樣當配合非阻塞的socket使用時,只有當系統通知我哪一個描述符可讀了,我纔去執行read操做,能夠保證每次read都能讀到有效數據而不作純返回-1和EAGAIN的無用功。寫操做相似。操做系統的這個功能經過select/poll/epoll之類的系統調用來實現,這些函數均可以同時監視多個描述符的讀寫就緒情況,這樣,**多個描述符的I/O操做都能在一個線程內併發交替地順序完成,這就叫I/O多路複用,這裏的「複用」指的是複用同一個線程。編程

1、I/O複用之select

一、介紹: 
select系統調用的目的是:在一段指定時間內,監聽用戶感興趣的文件描述符上的可讀、可寫和異常事件。poll和select應該被歸類爲這樣的系統調用,它們能夠阻塞地同時探測一組支持非阻塞的IO設備,直至某一個設備觸發了事件或者超過了指定的等待時間——也就是說它們的職責不是作IO,而是幫助調用者尋找當前就緒的設備。 
下面是select的原理圖: 
這裏寫圖片描述數組

二、select系統調用API以下:安全

#include <sys/time.h>
#include <sys/types.h>
#include <unistd.h>
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
  • 1
  • 2
  • 3
  • 4

fd_set結構體是文件描述符集,該結構體其實是一個整型數組,數組中的每一個元素的每一位標記一個文件描述符。fd_set能容納的文件描述符數量由FD_SETSIZE指定,通常狀況下,FD_SETSIZE等於1024,這就限制了select能同時處理的文件描述符的總量。網絡

三、下面介紹一下各個參數的含義: 
1)nfds參數指定被監聽的文件描述符的總數。一般被設置爲select監聽的全部文件描述符中最大值加1; 
2)readfds、writefds、exceptfds分別指向可讀、可寫和異常等事件對應的文件描述符集合。這三個參數都是傳入傳出型參數,指的是在調用select以前,用戶把關心的可讀、可寫、或異常的文件描述符經過FD_SET(下面介紹)函數分別添加進readfds、writefds、exceptfds文件描述符集,select將對這些文件描述符集中的文件描述符進行監聽,若是有就緒文件描述符,select會重置readfds、writefds、exceptfds文件描述符集來通知應用程序哪些文件描述符就緒。這個特性將致使select函數返回後,再次調用select以前,必須重置咱們關心的文件描述符,也就是三個文件描述符集已經不是咱們以前傳入 的了。 
3)timeout參數用來指定select函數的超時時間(下面講select返回值時還會談及)。併發

struct timeval
{
    long tv_sec;        //秒數
    long tv_usec;       //微秒數
};
  • 1
  • 2
  • 3
  • 4
  • 5

四、下面幾個函數(宏實現)用來操縱文件描述符集:socket

void FD_SET(int fd, fd_set *set);   //在set中設置文件描述符fd
void FD_CLR(int fd, fd_set *set);   //清除set中的fd位
int  FD_ISSET(int fd, fd_set *set); //判斷set中是否設置了文件描述符fd
void FD_ZERO(fd_set *set);          //清空set中的全部位(在使用文件描述符集前,應該先清空一下)
    //(注意FD_CLR和FD_ZERO的區別,一個是清除某一位,一個是清除全部位)
  • 1
  • 2
  • 3
  • 4
  • 5

五、select的返回狀況: 
1)若是指定timeout爲NULL,select會永遠等待下去,直到有一個文件描述符就緒,select返回; 
2)若是timeout的指定時間爲0,select根本不等待,當即返回; 
3)若是指定一段固定時間,則在這一段時間內,若是有指定的文件描述符就緒,select函數返回,若是超過指定時間,select一樣返回。 
4)返回值狀況: 
a)超時時間內,若是文件描述符就緒,select返回就緒的文件描述符總數(包括可讀、可寫和異常),若是沒有文件描述符就緒,select返回0; 
b)select調用失敗時,返回 -1並設置errno,若是收到信號,select返回 -1並設置errno爲EINTR。函數

六、文件描述符的就緒條件: 
在網絡編程中, 
1)下列狀況下socket可讀: 
a) socket內核接收緩衝區的字節數大於或等於其低水位標記SO_RCVLOWAT; 
b) socket通訊的對方關閉鏈接,此時該socket可讀,可是一旦讀該socket,會當即返回0(能夠用這個方法判斷client端是否斷開鏈接); 
c) 監聽socket上有新的鏈接請求; 
d) socket上有未處理的錯誤。 
2)下列狀況下socket可寫: 
a) socket內核發送緩衝區的可用字節數大於或等於其低水位標記SO_SNDLOWAT; 
b) socket的讀端關閉,此時該socket可寫,一旦對該socket進行操做,該進程會收到SIGPIPE信號; 
c) socket使用connect鏈接成功以後; 
d) socket上有未處理的錯誤。性能

2、I/O複用之poll

一、poll系統調用的原理與原型和select基本相似,也是在指定時間內輪詢必定數量的文件描述符,以測試其中是否有就緒者。測試

二、poll系統調用API以下:ui

#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
  • 1
  • 2

三、下面介紹一下各個參數的含義: 
1)第一個參數是指向一個結構數組的第一個元素的指針,每一個元素都是一個pollfd結構,用於指定測試某個給定描述符的條件。

struct pollfd
{
    int fd;             //指定要監聽的文件描述符
    short events;       //指定監聽fd上的什麼事件
    short revents;      //fd上事件就緒後,用於保存實際發生的時間
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

待監聽的事件由events成員指定,函數在相應的revents成員中返回該描述符的狀態(每一個文件描述符都有兩個事件,一個是傳入型的events,一個是傳出型的revents,從而避免使用傳入傳出型參數,注意與select的區別),從而告知應用程序fd上實際發生了哪些事件。events和revents均可以是多個事件的按位或。 
2)第二個參數是要監聽的文件描述符的個數,也就是數組fds的元素個數; 
3)第三個參數意義與select相同。

四、poll的事件類型: 
這裏寫圖片描述 
在使用POLLRDHUP時,要在代碼開始處定義_GNU_SOURCE

五、poll的返回狀況: 
與select相同。

3、I/O複用之epoll

一、介紹: 
epoll 與select和poll在使用和實現上有很大區別。首先,epoll使用一組函數來完成,而不是單獨的一個函數;其次,epoll把用戶關心的文件描述符上的事件放在內核裏的一個事件表中,無須向select和poll那樣每次調用都要重複傳入文件描述符集合事件集。

二、建立一個文件描述符,指定內核中的事件表:

#include<sys/epoll.h>
int epoll_create(int size);
    //調用成功返回一個文件描述符,失敗返回-1並設置errno。
  • 1
  • 2
  • 3

size參數並不起做用,只是給內核一個提示,告訴它事件表須要多大。該函數返回的文件描述符指定要訪問的內核事件表,是其餘全部epoll系統調用的句柄。

三、操做內核事件表:

#include<sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
    //調用成功返回0,調用失敗返回-1並設置errno。
  • 1
  • 2
  • 3

epfd是epoll_create返回的文件句柄,標識事件表,op指定操做類型。操做類型有如下3種:

a)EPOLL_CTL_ADD, 往事件表中註冊fd上的事件;
b)EPOLL_CTL_MOD, 修改fd上註冊的事件;
c)EPOLL_CTL_DEL, 刪除fd上註冊的事件。
  • 1
  • 2
  • 3

event參數指定事件,epoll_event的定義以下:

struct epoll_event
{
    __int32_t events;       //epoll事件
    epoll_data_t data;      //用戶數據
};

typedef union epoll_data
{
    void *ptr;
    int  fd;
    uint32_t u32;
    uint64_t u64;
}epoll_data;
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

在使用epoll_ctl時,是把fd添加、修改到內核事件表中,或從內核事件表中刪除fd的事件。若是是添加事件到事件表中,能夠往data中的fd上添加事件events,或者不用data中的fd,而把fd放到用戶數據ptr所指的內存中(由於epoll_data是一個聯合體,只能使用其中一個數據),再設置events。

三、epoll_wait函數 
epoll系統調用的最關鍵的一個函數epoll_wait,它在一段時間內等待一個組文件描述符上的事件。

#include<sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
    //函數調用成功返回就緒文件描述符個數,失敗返回-1並設置errno。
  • 1
  • 2
  • 3

timeout參數和select與poll相同,指定一個超時時間;maxevents指定最多監聽多少個事件;events是一個傳出型參數,epoll_wait函數若是檢測到事件就緒,就將全部就緒的事件從內核事件表(epfd所指的文件)中複製到events指定的數組中。這個數組用來輸出epoll_wait檢測到的就緒事件,而不像select與poll那樣,這也是epoll與前者最大的區別,下文在比較三者之間的區別時還會說到。

4、三組I/O複用函數的比較

相同點: 
1)三者都須要在fd上註冊用戶關心的事件; 
2)三者都要一個timeout參數指定超時時間; 
不一樣點: 
1)select: 
a)select指定三個文件描述符集,分別是可讀、可寫和異常事件,因此不能更加細緻地區分全部可能發生的事件; 
b)select若是檢測到就緒事件,會在原來的文件描述符上改動,以告知應用程序,文件描述符上發生了什麼時間,因此再次調用select時,必須先重置文件描述符; 
c)select採用對全部註冊的文件描述符集輪詢的方式,會返回整個用戶註冊的事件集合,因此應用程序索引就緒文件的時間複雜度爲O(n); 
d)select容許監聽的最大文件描述符個數一般有限制,通常是1024,若是大於1024,select的性能會急劇降低; 
e)只能工做在LT模式。

2)poll: 
a)poll把文件描述符和事件綁定,事件不但能夠單獨指定,並且能夠是多個事件的按位或,這樣更加細化了事件的註冊,並且poll單獨採用一個元素用來保存就緒返回時的結果,這樣在下次調用poll時,就不用重置以前註冊的事件; 
b)poll採用對全部註冊的文件描述符集輪詢的方式,會返回整個用戶註冊的事件集合,因此應用程序索引就緒文件的時間複雜度爲O(n)。 
c)poll用nfds參數指定最多監聽多少個文件描述符和事件,這個數能達到系統容許打開的最大文件描述符數目,即65535。 
d)只能工做在LT模式。

3)epoll: 
a)epoll把用戶註冊的文件描述符和事件放到內核當中的事件表中,提供了一個獨立的系統調用epoll_ctl來管理用戶的事件,並且epoll採用回調的方式,一旦有註冊的文件描述符就緒,講觸發回調函數,該回調函數將就緒的文件描述符和事件拷貝到用戶空間events所管理的內存,這樣應用程序索引就緒文件的時間複雜度達到O(1)。 
b)epoll_wait使用maxevents來制定最多監聽多少個文件描述符和事件,這個數能達到系統容許打開的最大文件描述符數目,即65535; 
c)不只能工做在LT模式,並且還支持ET高效模式(即EPOLLONESHOT事件,讀者能夠本身查一下這個事件類型,對於epoll的線程安全有很好的幫助)。

select/poll/epoll總結: 
這裏寫圖片描述

相關文章
相關標籤/搜索