Linux Epoll相關知識

其實在Linux下設計併發網絡程序,向來不缺乏方法,好比典型的Apache模型(Process Per Connection,簡稱PPC),TPC(Thread PerConnection)模型,以及select模型和poll模型,那爲什麼還要再引入Epoll這個東東呢?那仍是有得說說的…網絡

1. 經常使用模型的缺點數據結構

  若是不擺出來其餘模型的缺點,怎麼能對比出Epoll的優勢呢。併發

1.1 PPC/TPC模型socket

  這兩種模型思想相似,就是讓每個到來的鏈接一邊本身作事去,別再來煩我。只是PPC是爲它開了一個進程,而TPC開了一個線程。但是別煩我是有代價的,它要時間和空間啊,鏈接多了以後,那麼多的進程/線程切換,這開銷就上來了;所以這類模型能接受的  最大鏈接數都不會高,通常在幾百個左右。函數

1.2 select模型測試

  1. 最大併發數限制,由於一個進程所打開的FD(文件描述符)是有限制的,由FD_SETSIZE設置,默認值是1024/2048,所以Select模型的最大併發數就被相應限制了。本身改改這個FD_SETSIZE?想法雖好,但是先看看下面吧…ui

  2. 效率問題,select每次調用都會線性掃描所有的FD集合,這樣效率就會呈現線性降低,把FD_SETSIZE改大的後果就是,你們都慢慢來,什麼?都超時了??!!spa

  3. 內核/用戶空間 內存拷貝問題,如何讓內核把FD消息通知給用戶空間呢?在這個問題上select採起了內存拷貝方法。線程

1.3 poll模型設計

  基本上效率和select是相同的,select缺點的2和3它都沒有改掉。

2. Epoll的提高

  把其餘模型逐個批判了一下,再來看看Epoll的改進之處吧,其實把select的缺點反過來那就是Epoll的優勢了。

  2.1. Epoll沒有最大併發鏈接的限制,上限是最大能夠打開文件的數目,這個數字通常遠大於2048, 通常來講這個數目和系統內存關係很大,具體數目能夠cat /proc/sys/fs/file-max察看。

  2.2. 效率提高,Epoll最大的優勢就在於它只管你「活躍」的鏈接,而跟鏈接總數無關,所以在實際的網絡環境中,Epoll的效率就會遠遠高於select和poll。

  2.3. 內存拷貝,Epoll在這點上使用了「共享內存」,這個內存拷貝也省略了。

3. Epoll爲何高效

  Epoll的高效和其數據結構的設計是密不可分的,這個下面就會提到。

  首先回憶一下select模型,當有I/O事件到來時,select通知應用程序有事件到了快去處理,而應用程序必須輪詢全部的FD集合,測試每一個FD是否有事件發生,並處理事件;代碼像下面這樣:

int res = select(maxfd+1, &readfds, NULL, NULL, 120);

if(res > 0)

{

    for(int i = 0; i < MAX_CONNECTION; i++)

    {

        if(FD_ISSET(allConnection[i],&readfds))

        {

            handleEvent(allConnection[i]);

        }

    }

}

// if(res == 0) handle timeout, res < 0 handle error

Epoll不只會告訴應用程序有I/0事件到來,還會告訴應用程序相關的信息,這些信息是應用程序填充的,所以根據這些信息應用程序就能直接定位到事件,而沒必要遍歷整個FD集合。

int res = epoll_wait(epfd, events, 20, 120);

for(int i = 0; i < res;i++)

{

    handleEvent(events[n]);

}

4. Epoll關鍵數據結構

  前面提到Epoll速度快和其數據結構密不可分,其關鍵數據結構就是:

struct epoll_event {

    __uint32_t events;      // Epoll events

    epoll_data_t data;      // User datavariable

};

typedef union epoll_data {

    void *ptr;

   int fd;

    __uint32_t u32;

    __uint64_t u64;

} epoll_data_t;

  可見epoll_data是一個union結構體,藉助於它應用程序能夠保存不少類型的信息:fd、指針等等。有了它,應用程序就能夠直接定位目標了。

5. 使用Epoll

  epoll的使用主要在於三個函數。

  1. epoll_create(int size);

  建立一個epoll的句柄,size用來告訴內核這個監聽的數目最大值。 注意!是數量的最大值,不是fd的最大值,切勿搞混。 當建立好epoll句柄後,它就是會佔用一個fd值,因此在使用完epoll後,必須調用close()關閉,不然可能致使fd被耗盡。

  2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

  epoll的事件註冊函數。 epfd是epoll的句柄,即epoll_create的返回值; op表示動做:用三個宏表示: EPOLL_CTL_ADD:註冊新的fd到epfd中; EPOLL_CTL_MOD:修改已經註冊的fd的監聽事件; EPOLL_CTL_DEL:從epfd中刪除一個fd; fd是須要監聽的套接字描述符; event是設定監聽事件的結構體,數據結構以下:

  

typedef union epoll_data
{
    void *ptr;
    int fd;
    __uint32_t u32;
    __uint64_t u64
}epoll_data_t;
struct epoll_event 
{
  __uint32_t events;  /* Epoll events */
  epoll_data_t data;  /* User data variable */
};
events能夠是如下幾個宏的集合:
EPOLLIN :表示對應的文件描述符能夠讀(包括對端SOCKET正常關閉);
EPOLLOUT:表示對應的文件描述符能夠寫;
EPOLLPRI:表示對應的文件描述符有緊急的數據可讀(這裏應該表示有帶外數據到來);
EPOLLERR:表示對應的文件描述符發生錯誤; EPOLLHUP:表示對應的文件描述符被掛斷;
EPOLLET: 將EPOLL設爲邊緣觸發(Edge Triggered)模式,這是相對於水平觸發(Level Triggered)來講的。
EPOLLONESHOT:只監聽一次事件,當監聽完此次事件以後,就會把這個fd從epoll的隊列中刪除。
若是還須要繼續監聽這個socket的話,須要再次把這個fd加入到EPOLL隊列裏

  3. int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

  等待事件的產生,返回須要處理的事件的數量,並將需處理事件的套接字集合於參數events內,能夠遍歷events來處理事件。

  參數epfd爲epoll句柄 events爲事件集合 參數timeout是超時時間(毫秒,0會當即返回,-1是永久阻塞)。

  該函數返回須要處理的事件數目,如返回0表示已超時。

  4.使用實例

  1 #include <sys/socket.h>
  2 #include <sys/epoll.h>
  3 #include <netinet/in.h>
  4 #include <arpa/inet.h>
  5 #include <fcntl.h>
  6 #include <unistd.h>
  7 #include <stdio.h>
  8 #include <errno.h>
  9 #include <stdlib.h>
 10 #include <string.h>
 11 
 12 #define MAXLINE 10   //最大長度
 13 #define OPEN_MAX 100
 14 #define LISTENQ 20
 15 #define SERV_PORT 8000
 16 #define INFTIM 1000
 17 #define IP_ADDR "10.73.219.151"
 18 
 19 int main()
 20 {
 21     struct epoll_event ev, events[20];
 22     struct sockaddr_in clientaddr, serveraddr;
 23     int epfd;
 24     int listenfd;//監聽fd
 25     int maxi;
 26     int nfds;
 27     int i;
 28     int sock_fd, conn_fd;
 29     char buf[MAXLINE];
 30 
 31     epfd = epoll_create(256);//生成epoll句柄
 32     listenfd = socket(AF_INET, SOCK_STREAM, 0);//建立套接字
 33     ev.data.fd = listenfd;//設置與要處理事件相關的文件描述符
 34     ev.events = EPOLLIN;//設置要處理的事件類型
 35 
 36     epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);//註冊epoll事件
 37 
 38     memset(&serveraddr, 0, sizeof(serveraddr));
 39     serveraddr.sin_family = AF_INET;
 40     serveraddr.sin_addr.s_addr = htonl(INADDR_ANY);
 41     serveraddr.sin_port = htons(SERV_PORT);
 42     bind(listenfd,(struct sockaddr*)&serveraddr, sizeof(serveraddr));//綁定套接口
 43     socklen_t clilen;
 44     listen(listenfd, LISTENQ);//轉爲監聽套接字
 45     int n;
 46     while(1)
 47     {
 48         nfds = epoll_wait(epfd,events,20,500);//等待事件發生
 49         //處理所發生的全部事件
 50         for(i=0;i<nfds;i++)
 51         {
 52             if(events[i].data.fd == listenfd)//有新的鏈接
 53             {
 54                 clilen = sizeof(struct sockaddr_in);
 55                 conn_fd = accept(listenfd, (struct sockaddr*)&clientaddr, &clilen);
 56                 printf("accept a new client : %s\n",inet_ntoa(clientaddr.sin_addr));
 57                 ev.data.fd = conn_fd;
 58                 ev.events = EPOLLIN;//設置監聽事件爲可寫
 59                 epoll_ctl(epfd, EPOLL_CTL_ADD, conn_fd, &ev);//新增套接字
 60             }
 61             else if(events[i].events & EPOLLIN)//可讀事件
 62             {
 63                 if((sock_fd = events[i].data.fd) < 0)
 64                     continue;
 65                 if((n = recv(sock_fd, buf, MAXLINE, 0)) < 0)
 66                 {
 67                     if(errno == ECONNRESET)
 68                     {
 69                         close(sock_fd);
 70                         events[i].data.fd = -1;
 71                     }
 72                     else
 73                     {
 74                         printf("readline error\n");
 75                     }
 76                 }
 77                 else if(n == 0)
 78                 {
 79                     close(sock_fd);
 80                     printf("關閉\n");
 81                     events[i].data.fd = -1;
 82                 }
 83 
 84                 printf("%d -- > %s\n",sock_fd, buf);
 85                 ev.data.fd = sock_fd;
 86                 ev.events = EPOLLOUT;
 87                 epoll_ctl(epfd,EPOLL_CTL_MOD,sock_fd,&ev);//修改監聽事件爲可讀
 88             }
 89 
 90             else if(events[i].events & EPOLLOUT)//可寫事件
 91             {
 92                 sock_fd = events[i].data.fd;
 93                 printf("OUT\n");
 94                 scanf("%s",buf);
 95                 send(sock_fd, buf, MAXLINE, 0);
 96 
 97                 ev.data.fd = sock_fd;
 98                 ev.events = EPOLLIN;
 99                 epoll_ctl(epfd, EPOLL_CTL_MOD,sock_fd, &ev);
100             }
101         }
102     }
103 
104     return 0;   
105 }
相關文章
相關標籤/搜索