其實在Linux下設計併發網絡程序,向來不缺乏方法,好比典型的Apache模型(Process Per Connection,簡稱PPC),TPC(Thread PerConnection)模型,以及select模型和poll模型,那爲什麼還要再引入Epoll這個東東呢?那仍是有得說說的…網絡
1. 經常使用模型的缺點數據結構
若是不擺出來其餘模型的缺點,怎麼能對比出Epoll的優勢呢。併發
1.1 PPC/TPC模型socket
這兩種模型思想相似,就是讓每個到來的鏈接一邊本身作事去,別再來煩我。只是PPC是爲它開了一個進程,而TPC開了一個線程。但是別煩我是有代價的,它要時間和空間啊,鏈接多了以後,那麼多的進程/線程切換,這開銷就上來了;所以這類模型能接受的 最大鏈接數都不會高,通常在幾百個左右。函數
1.2 select模型測試
1. 最大併發數限制,由於一個進程所打開的FD(文件描述符)是有限制的,由FD_SETSIZE設置,默認值是1024/2048,所以Select模型的最大併發數就被相應限制了。本身改改這個FD_SETSIZE?想法雖好,但是先看看下面吧…ui
2. 效率問題,select每次調用都會線性掃描所有的FD集合,這樣效率就會呈現線性降低,把FD_SETSIZE改大的後果就是,你們都慢慢來,什麼?都超時了??!!spa
3. 內核/用戶空間 內存拷貝問題,如何讓內核把FD消息通知給用戶空間呢?在這個問題上select採起了內存拷貝方法。線程
1.3 poll模型設計
基本上效率和select是相同的,select缺點的2和3它都沒有改掉。
2. Epoll的提高
把其餘模型逐個批判了一下,再來看看Epoll的改進之處吧,其實把select的缺點反過來那就是Epoll的優勢了。
2.1. Epoll沒有最大併發鏈接的限制,上限是最大能夠打開文件的數目,這個數字通常遠大於2048, 通常來講這個數目和系統內存關係很大,具體數目能夠cat /proc/sys/fs/file-max察看。
2.2. 效率提高,Epoll最大的優勢就在於它只管你「活躍」的鏈接,而跟鏈接總數無關,所以在實際的網絡環境中,Epoll的效率就會遠遠高於select和poll。
2.3. 內存拷貝,Epoll在這點上使用了「共享內存」,這個內存拷貝也省略了。
3. Epoll爲何高效
Epoll的高效和其數據結構的設計是密不可分的,這個下面就會提到。
首先回憶一下select模型,當有I/O事件到來時,select通知應用程序有事件到了快去處理,而應用程序必須輪詢全部的FD集合,測試每一個FD是否有事件發生,並處理事件;代碼像下面這樣:
int res = select(maxfd+1, &readfds, NULL, NULL, 120); if(res > 0) { for(int i = 0; i < MAX_CONNECTION; i++) { if(FD_ISSET(allConnection[i],&readfds)) { handleEvent(allConnection[i]); } } } // if(res == 0) handle timeout, res < 0 handle error
Epoll不只會告訴應用程序有I/0事件到來,還會告訴應用程序相關的信息,這些信息是應用程序填充的,所以根據這些信息應用程序就能直接定位到事件,而沒必要遍歷整個FD集合。
int res = epoll_wait(epfd, events, 20, 120); for(int i = 0; i < res;i++) { handleEvent(events[n]); }
4. Epoll關鍵數據結構
前面提到Epoll速度快和其數據結構密不可分,其關鍵數據結構就是:
struct epoll_event { __uint32_t events; // Epoll events epoll_data_t data; // User datavariable }; typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64; } epoll_data_t;
可見epoll_data是一個union結構體,藉助於它應用程序能夠保存不少類型的信息:fd、指針等等。有了它,應用程序就能夠直接定位目標了。
5. 使用Epoll
epoll的使用主要在於三個函數。
1. epoll_create(int size);
建立一個epoll的句柄,size用來告訴內核這個監聽的數目最大值。 注意!是數量的最大值,不是fd的最大值,切勿搞混。 當建立好epoll句柄後,它就是會佔用一個fd值,因此在使用完epoll後,必須調用close()關閉,不然可能致使fd被耗盡。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件註冊函數。 epfd是epoll的句柄,即epoll_create的返回值; op表示動做:用三個宏表示: EPOLL_CTL_ADD:註冊新的fd到epfd中; EPOLL_CTL_MOD:修改已經註冊的fd的監聽事件; EPOLL_CTL_DEL:從epfd中刪除一個fd; fd是須要監聽的套接字描述符; event是設定監聽事件的結構體,數據結構以下:
typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64 }epoll_data_t; struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ };
events能夠是如下幾個宏的集合:
EPOLLIN :表示對應的文件描述符能夠讀(包括對端SOCKET正常關閉);
EPOLLOUT:表示對應的文件描述符能夠寫;
EPOLLPRI:表示對應的文件描述符有緊急的數據可讀(這裏應該表示有帶外數據到來);
EPOLLERR:表示對應的文件描述符發生錯誤; EPOLLHUP:表示對應的文件描述符被掛斷;
EPOLLET: 將EPOLL設爲邊緣觸發(Edge Triggered)模式,這是相對於水平觸發(Level Triggered)來講的。
EPOLLONESHOT:只監聽一次事件,當監聽完此次事件以後,就會把這個fd從epoll的隊列中刪除。
若是還須要繼續監聽這個socket的話,須要再次把這個fd加入到EPOLL隊列裏
3. int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
等待事件的產生,返回須要處理的事件的數量,並將需處理事件的套接字集合於參數events內,能夠遍歷events來處理事件。
參數epfd爲epoll句柄 events爲事件集合 參數timeout是超時時間(毫秒,0會當即返回,-1是永久阻塞)。
該函數返回須要處理的事件數目,如返回0表示已超時。
4.使用實例
1 #include <sys/socket.h> 2 #include <sys/epoll.h> 3 #include <netinet/in.h> 4 #include <arpa/inet.h> 5 #include <fcntl.h> 6 #include <unistd.h> 7 #include <stdio.h> 8 #include <errno.h> 9 #include <stdlib.h> 10 #include <string.h> 11 12 #define MAXLINE 10 //最大長度 13 #define OPEN_MAX 100 14 #define LISTENQ 20 15 #define SERV_PORT 8000 16 #define INFTIM 1000 17 #define IP_ADDR "10.73.219.151" 18 19 int main() 20 { 21 struct epoll_event ev, events[20]; 22 struct sockaddr_in clientaddr, serveraddr; 23 int epfd; 24 int listenfd;//監聽fd 25 int maxi; 26 int nfds; 27 int i; 28 int sock_fd, conn_fd; 29 char buf[MAXLINE]; 30 31 epfd = epoll_create(256);//生成epoll句柄 32 listenfd = socket(AF_INET, SOCK_STREAM, 0);//建立套接字 33 ev.data.fd = listenfd;//設置與要處理事件相關的文件描述符 34 ev.events = EPOLLIN;//設置要處理的事件類型 35 36 epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);//註冊epoll事件 37 38 memset(&serveraddr, 0, sizeof(serveraddr)); 39 serveraddr.sin_family = AF_INET; 40 serveraddr.sin_addr.s_addr = htonl(INADDR_ANY); 41 serveraddr.sin_port = htons(SERV_PORT); 42 bind(listenfd,(struct sockaddr*)&serveraddr, sizeof(serveraddr));//綁定套接口 43 socklen_t clilen; 44 listen(listenfd, LISTENQ);//轉爲監聽套接字 45 int n; 46 while(1) 47 { 48 nfds = epoll_wait(epfd,events,20,500);//等待事件發生 49 //處理所發生的全部事件 50 for(i=0;i<nfds;i++) 51 { 52 if(events[i].data.fd == listenfd)//有新的鏈接 53 { 54 clilen = sizeof(struct sockaddr_in); 55 conn_fd = accept(listenfd, (struct sockaddr*)&clientaddr, &clilen); 56 printf("accept a new client : %s\n",inet_ntoa(clientaddr.sin_addr)); 57 ev.data.fd = conn_fd; 58 ev.events = EPOLLIN;//設置監聽事件爲可寫 59 epoll_ctl(epfd, EPOLL_CTL_ADD, conn_fd, &ev);//新增套接字 60 } 61 else if(events[i].events & EPOLLIN)//可讀事件 62 { 63 if((sock_fd = events[i].data.fd) < 0) 64 continue; 65 if((n = recv(sock_fd, buf, MAXLINE, 0)) < 0) 66 { 67 if(errno == ECONNRESET) 68 { 69 close(sock_fd); 70 events[i].data.fd = -1; 71 } 72 else 73 { 74 printf("readline error\n"); 75 } 76 } 77 else if(n == 0) 78 { 79 close(sock_fd); 80 printf("關閉\n"); 81 events[i].data.fd = -1; 82 } 83 84 printf("%d -- > %s\n",sock_fd, buf); 85 ev.data.fd = sock_fd; 86 ev.events = EPOLLOUT; 87 epoll_ctl(epfd,EPOLL_CTL_MOD,sock_fd,&ev);//修改監聽事件爲可讀 88 } 89 90 else if(events[i].events & EPOLLOUT)//可寫事件 91 { 92 sock_fd = events[i].data.fd; 93 printf("OUT\n"); 94 scanf("%s",buf); 95 send(sock_fd, buf, MAXLINE, 0); 96 97 ev.data.fd = sock_fd; 98 ev.events = EPOLLIN; 99 epoll_ctl(epfd, EPOLL_CTL_MOD,sock_fd, &ev); 100 } 101 } 102 } 103 104 return 0; 105 }