第一部分:Epoll簡介html
問題 : Select,Poll和Epoll的區別linux
答案 : ios
Epoll和Select的區別編程
2. 數目的區別。select通常由一個內核參數(1024)限制了監聽的句柄數,可是epoll一般受限於打開文件的數目,一般會打得多。數組
3. epoll自身,還有兩種觸發方式。水平觸發和邊緣觸發。邊沿觸發的效率更高(高了很多,可是編程的時候要當心處理每一個時間,防止漏掉處理某些事件)。bash
Select服務器
#include <sys/time.h> #include <sys/types.h> #include <unistd.h> int select (int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); FD_CLR(int fd, fd_set *set); FD_ISSET(int fd, fd_set *set); FD_SET(int fd, fd_set *set); FD_ZERO(fd_set *set); |
調用select()將阻塞,直到指定的文件描述符準備好執行I/O,或者可選參數timeout指定的時間已通過去。網絡
select()成功返回時,每組set都被修改以使它只包含準備好I/O的文件描述符。例如,假設有兩個文件描述符,值分別是7和9,被放在readfds中。當select()返回時,若是7仍然在set中,則這個文件描述符已經準備好被讀取而不會阻塞。若是9已經不在set中,則讀取它將可能會阻塞(我說多是由於數據可能正好在select返回後就可用,這種狀況下,下一次調用select()將返回文件描述符準備好讀取)。數據結構
Pollsocket
和select()不同,poll()沒有使用低效的三個基於位的文件描述符set,而是採用了一個單獨的結構體pollfd數組,由fds指針指向這個組。pollfd結構體定義以下:
#include <sys/poll.h> int poll (struct pollfd *fds, unsigned int nfds, int timeout); struct pollfd { int fd; /* file descriptor */ short events; /* requested events to watch */ short revents; /* returned events witnessed */ }; |
每個pollfd結構體指定了一個被監視的文件描述符,能夠傳遞多個結構體,指示poll()監視多個文件描述符。每一個結構體的events域是監視該文件描述符的事件掩碼,由用戶來設置這個域。revents域是文件描述符的操做結果事件掩碼。內核在調用返回時設置這個域。events域中請求的任何事件均可能在revents域中返回。合法的事件以下:
POLLIN:有數據可讀。
POLLIN | POLLPRI等價於select()的讀事件,POLLOUT | POLLWRBAND等價於select()的寫事件。POLLIN等價於POLLRDNORM | POLLRDBAND,而POLLOUT則等價於POLLWRNORM。
例如,要同時監視一個文件描述符是否可讀和可寫,咱們能夠設置events爲POLLIN | POLLOUT。在poll返回時,咱們能夠檢查revents中的標誌,對應於文件描述符請求的events結構體。若是POLLIN事件被設置,則文件描述符能夠被讀取而不阻塞。若是POLLOUT被設置,則文件描述符能夠寫入而不致使阻塞。這些標誌並非互斥的:它們可能被同時設置,表示這個文件描述符的讀取和寫入操做都會正常返回而不阻塞。
timeout參數指定等待的毫秒數,不管I/O是否準備好,poll都會返回。timeout指定爲負數值表示無限超時;timeout爲0指示poll調用當即返回並列出準備好I/O的文件描述符,但並不等待其它的事件。這種狀況下,poll()就像它的名字那樣,一旦選舉出來,當即返回。
返回值和錯誤代碼
成功時,poll()返回結構體中revents域不爲0的文件描述符個數;若是在超時前沒有任何事件發生,poll()返回0;失敗時,poll()返回-1,並設置errno爲下列值之一:
EBADF:一個或多個結構體中指定的文件描述符無效。
EFAULT:fds指針指向的地址超出進程的地址空間。
EINTR:請求的事件以前產生一個信號,調用能夠從新發起。
EINVAL:nfds參數超出PLIMIT_NOFILE值。
ENOMEM:可用內存不足,沒法完成請求。
Epoll
Epoll的優勢:
1.支持一個進程打開大數目的socket描述符(FD)
select 最不能忍受的是一個進程所打開的FD是有必定限制的,由FD_SETSIZE設置,默認值是2048。對於那些須要支持的上萬鏈接數目的IM服務器來講顯然太少了。這時候你一是能夠選擇修改這個宏而後從新編譯內核,不過資料也同時指出這樣會帶來網絡效率的降低,二是能夠選擇多進程的解決方案(傳統的 Apache方案),不過雖然linux上面建立進程的代價比較小,但仍舊是不可忽視的,加上進程間數據同步遠比不上線程間同步的高效,因此也不是一種完美的方案。不過 epoll則沒有這個限制,它所支持的FD上限是最大能夠打開文件的數目,這個數字通常遠大於2048,舉個例子,在1GB內存的機器上大約是10萬左右,具體數目能夠cat /proc/sys/fs/file-max察看,通常來講這個數目和系統內存關係很大。
2.IO效率不隨FD數目增長而線性降低
傳統的select/poll另外一個致命弱點就是當你擁有一個很大的socket集合,不過因爲網絡延時,任一時間只有部分的socket是"活躍"的,可是select/poll每次調用都會線性掃描所有的集合,致使效率呈現線性降低。可是epoll不存在這個問題,它只會對"活躍"的socket進行操做---這是由於在內核實現中epoll是根據每一個fd上面的callback函數實現的。那麼,只有"活躍"的socket纔會主動的去調用 callback函數,其餘idle狀態socket則不會,在這點上,epoll實現了一個"僞"AIO,由於這時候推進力在os內核。在一些 benchmark中,若是全部的socket基本上都是活躍的---好比一個高速LAN環境,epoll並不比select/poll有什麼效率,相反,若是過多使用epoll_ctl,效率相比還有稍微的降低。可是一旦使用idle connections模擬WAN環境,epoll的效率就遠在select/poll之上了。
3.使用mmap加速內核與用戶空間的消息傳遞。
這點實際上涉及到epoll的具體實現了。不管是select,poll仍是epoll都須要內核把FD消息通知給用戶空間,如何避免沒必要要的內存拷貝就很重要,在這點上,epoll是經過內核於用戶空間mmap同一塊內存實現的。而若是你想我同樣從2.5內核就關注epoll的話,必定不會忘記手工 mmap這一步的。
Epoll簡介:
在linux的網絡編程中,很長的時間都在使用select來作事件觸發。在linux新的內核中,有了一種替換它的機制,就是epoll。
第二部分:Epoll的三個例子
typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64; } epoll_data_t; struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ }; |
該函數用於輪詢I/O事件的發生;參數:epfd:由epoll_create 生成的epoll專用的文件描述符;epoll_event:用於回傳代處理事件的數組;maxevents:每次能處理的事件數;timeout:等待I/O事件發生的超時值;返回發生事件數。
#include <iostream> #include <sys/socket.h> #include <sys/epoll.h> #include <netinet/in.h> #include <arpa/inet.h> #include <fcntl.h> #include <unistd.h> #include <stdio.h> #define MAXLINE 10 #define OPEN_MAX 100 #define LISTENQ 20 #define SERV_PORT 5555 #define INFTIM 1000 void setnonblocking(int sock) { int opts; opts = fcntl(sock, F_GETFL); if(opts < 0) { perror("fcntl(sock,GETFL)"); exit(1); } opts = opts | O_NONBLOCK; if(fcntl(sock, F_SETFL, opts) < 0) { perror("fcntl(sock,SETFL,opts)"); exit(1); } } int main() { int i, maxi, listenfd, connfd, sockfd, epfd, nfds; ssize_t n; char line[MAXLINE]; socklen_t clilen; //聲明epoll_event結構體的變量,ev用於註冊事件,數組用於回傳要處理的事件 struct epoll_event ev, events[20]; //生成用於處理accept的epoll專用的文件描述符 epfd = epoll_create(256); struct sockaddr_in clientaddr; struct sockaddr_in serveraddr; listenfd = socket(AF_INET, SOCK_STREAM, 0); //把socket設置爲非阻塞方式 setnonblocking(listenfd); //設置與要處理的事件相關的文件描述符 ev.data.fd = listenfd; //設置要處理的事件類型 ev.events = EPOLLIN | EPOLLET; //註冊epoll事件 epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev); bzero(&serveraddr, sizeof(serveraddr)); serveraddr.sin_family = AF_INET; char *local_addr = "200.200.200.204"; inet_aton(local_addr, &(serveraddr.sin_addr)); //htons(SERV_PORT); serveraddr.sin_port = htons(SERV_PORT); bind(listenfd, (sockaddr *)&serveraddr, sizeof(serveraddr)); listen(listenfd, LISTENQ); maxi = 0; for ( ; ; ) { //等待epoll事件的發生 nfds = epoll_wait(epfd, events, 20, 500); //處理所發生的全部事件 for(i = 0; i < nfds; ++i) { if(events[i].data.fd == listenfd) { connfd = accept(listenfd, (sockaddr *)&clientaddr, &clilen); if(connfd < 0) { perror("connfd<0"); exit(1); } setnonblocking(connfd); char *str = inet_ntoa(clientaddr.sin_addr); std::cout << "connect from " < _u115 ? tr << std::endl; //設置用於讀操做的文件描述符 ev.data.fd = connfd; //設置用於注測的讀操做事件 ev.events = EPOLLIN | EPOLLET; //註冊ev epoll_ctl(epfd, EPOLL_CTL_ADD, connfd, &ev); } else if(events[i].events & EPOLLIN) { if ( (sockfd = events[i].data.fd) < 0) continue; if ( (n = read(sockfd, line, MAXLINE)) < 0) { if (errno == ECONNRESET) { close(sockfd); events[i].data.fd = -1; } else std::cout << "readline error" << std::endl; } else if (n == 0) { close(sockfd); events[i].data.fd = -1; } //設置用於寫操做的文件描述符 ev.data.fd = sockfd; //設置用於注測的寫操做事件 ev.events = EPOLLOUT | EPOLLET; //修改sockfd上要處理的事件爲EPOLLOUT epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev); } else if(events[i].events & EPOLLOUT) { sockfd = events[i].data.fd; write(sockfd, line, n); //設置用於讀操做的文件描述符 ev.data.fd = sockfd; //設置用於注測的讀操做事件 ev.events = EPOLLIN | EPOLLET; //修改sockfd上要處理的事件爲EPOLIN epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev); } } } } |
/* *\ 服務器端的源代碼 */ #include <netinet/in.h> #include <sys/types.h> #include <sys/socket.h> #include <fcntl.h> #include <iostream> #include <signal.h> #include <sys/epoll.h> #define MAXFDS 256 #define EVENTS 100 #define PORT 8888 int epfd; bool setNonBlock(int fd) { int flags = fcntl(fd, F_GETFL, 0); flags |= O_NONBLOCK; if(-1 == fcntl(fd, F_SETFL, flags)) return false; return true; } int main(int argc, char *argv[], char *evp[]) { int fd, nfds, confd; int on = 1; char *buffer[512]; struct sockaddr_in saddr, caddr; struct epoll_event ev, events[EVENTS]; if(-1 == socket(AF_INET, SOCKSTREAM), 0) { std::cout << "建立套接字出錯啦" << std::endl; return -1; } struct sigaction sig; sigemptyset(&sig.sa_mask); sig_handler = SIG_IGN; sigaction(SIGPIPE, &N > sig, NULL); epfd = epoll_create(MAXFDS); setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on)); memset(&saddr, 0, sizeof(saddr)); saddr.sin_family = AF_INET; saddr.sin_port = htons((short)(PORT)); saddr.sin_addr.s_addr = INADDR_ANY; if(-1 == bind(fd, (struct sockaddr *)&saddr, sizeof(saddr))) { std::cout << "套接字不能綁定到服務器上" << std::endl; return -1; } if(-1 == listen(fd, 32)) { std::cout << "監聽套接字的時候出錯了" << std::endl; return -1; } ev.data.fd = fd; ev.events = EPOLLIN; epoll_ctl(epfd, EPOLL_CTL_ADD, fd, &ev); while(true) { nfds = epoll_wait(epfd, &events, MAXFDS, 0); for(int i = 0; i < nfds; ++ i) { if(fd == events[i].data.fd) { memset(&caddr, sizeof(caddr)); cfd = accept(fd, (struct sockaddr *)&caddr, &sizeof(caddr)); if(-1 == cfd) { std::cout << "服務器接收套接字的時候出問題了" << std::endl; break; } setNonBlock(cfd); ev.data.fd = cfd; ev.events = EPOLLIN; epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &ev); } else if(events[i].data.fd & EPOLLIN) { bzero(&buffer, sizeof(buffer)); std::cout << "服務器端要讀取客戶端發過來的消息" << std::endl; ret = recv(events[i].data.fd, buffer, sizeof(buffer), 0); if(ret < 0) { std::cout << "服務器收到的消息出錯了" << endl; return -1; } std::cout << "接收到的消息爲:" << (char *) buffer << std::endl; ev.data.fd = events[i].data.fd; ev.events = EPOLLOUT; epoll_ctl(epfd, EPOLL_CTL_MOD, events[i].data.fd, &ev); } else if(events[i].data.fd & EPOLLOUT) { bzero(&buffer, sizeof(buffer)); bcopy("The Author@: magicminglee@Hotmail.com", buffer, sizeof("The Author@: magicminglee@Hotmail.com")); ret = send(events[i].data.fd, buffer, strlen(buffer)); if(ret < 0) { std::cout << "服務器發送消息給客戶端的時候出錯啦" << std::endl; return -1; } ev.data.fd = events[i].data.fd; epoll_ctl(epfd, EPOLL_CTL_DEL, ev.data.fd, &ev); } } } if(fd > 0) { shutdown(fd, SHUT_RDWR); close(fd); } } |
/* *\ 客戶端源代碼 */ #include <iostream> #include <netinet/in.h> #include <sys/types.h> #include <sys/socket.h> #define PORT 8888 int main(int argc, char *argv[], char *evp[]) { int fd; int on = 1; char *buffer[512]; struct sockaddr_in seraddr; memset(&seraddr, 0, sizeof(seraddr)); if((fd = socket(AF_INET, SOCK_STREAM, 0)) < 0) { std::cout << "客戶端建立套接字出錯了" << std::endl; return -1; } //若是用於屢次測試,那麼打開下面debug選項 #ifdef _Debug_ming setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on)); #endif seraddr.sin_port = htons((short)(PORT)); seraddr.sin_family = AF_INET; seraddr.sin_addr.s_addr = inet_addr("127.0.0.1");//設置本身的ip吧 //你也能夠採用無阻塞鏈接,不過須要對鏈接的錯誤結果進行分析處理 if(TEMP_FAILURE_RETRY(connect(fd, (struct sockaddr *)&seraddr, sizeof(seraddr)) < 0)) { std::cout << "鏈接錯誤了" << std::endl; return -1; } //下面就進行收發信息 bcopy("The Author@: magicminglee@Hotmail.com"); send(fd, buffer, strlen(buffer), 0); bzero(&buffer, sizeof(buffer)); recv(fd, buffer, sizeof(buffer), 0); exit(0); } |
#include <iostream> #include <sys/socket.h> #include <sys/epoll.h> #include <netinet/in.h> #include <arpa/inet.h> #include <fcntl.h> #include <unistd.h> #include <stdio.h> #include <errno.h> #include <stdlib.h> #include <string.h> #include <pthread.h> #define MAXLINE 1024 #define OPEN_MAX 100 #define LISTENQ 20 #define SERV_PORT 5555 #define INFTIM 1000 //線程池任務隊列結構體 struct task { int fd; //須要讀寫的文件描述符 struct task *next; //下一個任務 }; //用於保存向客戶端發送一次消息所需的相關數據 struct user_data { int fd; unsigned int n_size; char line[MAXLINE]; }; //線程的任務函數 void *readtask(void *args); void *writetask(void *args); //聲明epoll_event結構體的變量,ev用於註冊事件,數組用於回傳要處理的事件 struct epoll_event ev, events[20]; int epfd; pthread_mutex_t mutex; pthread_cond_t cond1; struct task *readhead = NULL, *readtail = NULL, *writehead = NULL; void setnonblocking(int sock) { int opts; opts = fcntl(sock, F_GETFL); if(opts < 0) { perror("fcntl(sock,GETFL)"); exit(1); } opts = opts | O_NONBLOCK; if(fcntl(sock, F_SETFL, opts) < 0) { perror("fcntl(sock,SETFL,opts)"); exit(1); } } int main() { int i, maxi, listenfd, connfd, sockfd, nfds; pthread_t tid1, tid2; struct task *new_task = NULL; struct user_data *rdata = NULL; socklen_t clilen; pthread_mutex_init(&mutex, NULL); pthread_cond_init(&cond1, NULL); //初始化用於讀線程池的線程,開啓兩個線程來完成任務,兩個線程會互斥地訪問任務鏈表 pthread_create(&tid1, NULL, readtask, NULL); pthread_create(&tid2, NULL, readtask, NULL); //生成用於處理accept的epoll專用的文件描述符 epfd = epoll_create(256); struct sockaddr_in clientaddr; struct sockaddr_in serveraddr; listenfd = socket(AF_INET, SOCK_STREAM, 0); //把socket設置爲非阻塞方式 setnonblocking(listenfd); //設置與要處理的事件相關的文件描述符 ev.data.fd = listenfd; //設置要處理的事件類型,當描述符可讀時出發,出發方式爲ET模式 ev.events = EPOLLIN | EPOLLET; //註冊epoll事件 epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev); bzero(&serveraddr, sizeof(serveraddr)); serveraddr.sin_family = AF_INET; const char *local_addr = "127.0.0.1"; inet_aton(local_addr, &(serveraddr.sin_addr)); //htons(SERV_PORT); serveraddr.sin_port = htons(SERV_PORT); bind(listenfd, (sockaddr *)&serveraddr, sizeof(serveraddr)); //開始監聽 listen(listenfd, LISTENQ); maxi = 0; for ( ; ; ) { //等待epoll事件的發生 nfds = epoll_wait(epfd, events, 20, 500); //處理所發生的全部事件 for(i = 0; i < nfds; ++i) { if(events[i].data.fd == listenfd) { connfd = accept(listenfd, (sockaddr *)&clientaddr, &clilen); if(connfd < 0) { perror("connfd<0"); exit(1); } setnonblocking(connfd); const char *str = inet_ntoa(clientaddr.sin_addr); std::cout << "connec_ from >> " << str << std::endl; //設置用於讀操做的文件描述符 ev.data.fd = connfd; //設置用於注測的讀操做事件 ev.events = EPOLLIN | EPOLLET; //註冊ev epoll_ctl(epfd, EPOLL_CTL_ADD, connfd, &ev); } else if(events[i].events & EPOLLIN) { printf("reading!\n"); if ( (sockfd = events[i].data.fd) < 0) continue; new_task = new task(); new_task->fd = sockfd; new_task->next = NULL; //添加新的讀任務 pthread_mutex_lock(&mutex); if(readhead == NULL) { readhead = new_task; readtail = new_task; } else { readtail->next = new_task; readtail = new_task; } //喚醒全部等待cond1條件的線程 pthread_cond_broadcast(&cond1); pthread_mutex_unlock(&mutex); } else if(events[i].events & EPOLLOUT) { rdata = (struct user_data *)events[i].data.ptr; sockfd = rdata->fd; write(sockfd, rdata->line, rdata->n_size); delete rdata; //設置用於讀操做的文件描述符 ev.data.fd = sockfd; //設置用於注測的讀操做事件 ev.events = EPOLLIN | EPOLLET; //修改sockfd上要處理的事件爲EPOLIN epoll_ctl(epfd, EPOLL_CTL_MOD, sockfd, &ev); } } } } void *readtask(void *args) { int fd = -1; unsigned int n; //用於把讀出來的數據傳遞出去 struct user_data *data = NULL; while(1) { //互斥訪問任務隊列 pthread_mutex_lock(&mutex); //等待到任務隊列不爲空 while(readhead == NULL) pthread_cond_wait(&cond1, &mutex); //線程阻塞,釋放互斥鎖,當等待的條件等到知足時,它會再次得到互斥鎖 fd = readhead->fd; //從任務隊列取出一個讀任務 struct task *tmp = readhead; readhead = readhead->next; delete tmp; pthread_mutex_unlock(&mutex); data = new user_data(); data->fd = fd; if ( (n = read(fd, data->line, MAXLINE)) < 0) { if (errno == ECONNRESET) close(fd); else std::cout << "readline error" << std::endl; if(data != NULL) delete data; } else if (n == 0) { //客戶端關閉了,其對應的鏈接套接字可能也被標記爲EPOLLIN,而後服務器去讀這個套接字 //結果發現讀出來的內容爲0,就知道客戶端關閉了。 close(fd); printf("Client close connect!\n"); if(data != NULL) delete data; } else { std::cout << "read from client: " << data->line << std::endl; data->n_size = n; //設置須要傳遞出去的數據 ev.data.ptr = data; //設置用於注測的寫操做事件 ev.events = EPOLLOUT | EPOLLET; //修改sockfd上要處理的事件爲EPOLLOUT epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &ev); } } } |
#include <stdio.h> #include <sys/types.h> #include <sys/socket.h> #include <sys/un.h> #include <netdb.h> #include <unistd.h> int main(int argc, char *argv[]) { int connect_fd; int ret; char snd_buf[1024]; int i; int port; int len; static struct sockaddr_in srv_addr; if(argc != 3) { printf("Usage: %s server_ip_address port\n", argv[0]); return 1; } port = atoi(argv[2]); connect_fd = socket(PF_INET, SOCK_STREAM, 0); if(connect_fd < 0) { perror("cannot create communication socket"); return 1; } memset(&srv_addr, 0, sizeof(srv_addr)); srv_addr.sin_family = AF_INET; srv_addr.sin_addr.s_addr = inet_addr(argv[1]); srv_addr.sin_port = htons(port); ret = connect(connect_fd, (struct sockaddr *)&srv_addr, sizeof(srv_addr)); if(ret == -1) { perror("cannot connect to the server"); close(connect_fd); return 1; } memset(snd_buf, 0, 1024); while(1) { write(STDOUT_FILENO, "input message:", 14); bzero(snd_buf, 1024); len = read(STDIN_FILENO, snd_buf, 1024); if(snd_buf[0] == '@') break; if(len > 0) write(connect_fd, snd_buf, len); len = read(connect_fd, snd_buf, len); if(len > 0) printf("Message from server: %s\n", snd_buf); } close(connect_fd); return 0; } |