深刻剖析epoll

時間 2019-12-05

標籤深刻剖析 epoll 简体版

原文原文鏈接

select的不足

在IO多路複用中select（poll）有諸多限制，不少人會說select的缺點是在Linux內核中，select所用到的FD_SET是有限的，（內核中有個參數__FD_SETSIZE定義了每一個FD_SET的句柄個數）。可是更重要的缺點卻觸及不到:併發

select 採用的是輪詢機制，select被調用時fd_set會被遍歷，致使其時間複雜度爲O（n）。
內核/用戶空間拷貝問題：當有事件發生，且select輪詢完後，fd_set會從內核態拷貝到用戶態

當併發上來後，輪詢的低效率和頻繁的內核態用戶態切換會致使select的性能急劇降低：
函數

epoll的內部調用流程

(0) 紅黑樹是在mmap出的內存上的，減小了用戶空間和內核空間的拷貝
(1) epoll_wait調用ep_poll，當rdlist爲空（無就緒fd）時掛起當前進程，知道rdlist不空時進程才被喚醒。
(2) 文件fd狀態改變（buffer由不可讀變爲可讀或由不可寫變爲可寫），致使相應fd上的回調函數ep_poll_callback()被調用。
(3) ep_poll_callback將相應fd對應epitem加入rdlist，致使rdlist不空，進程被喚醒，epoll_wait得以繼續執行。
(4) ep_events_transfer函數將rdlist中的epitem拷貝到txlist中，並將rdlist清空。
(5) ep_send_events函數，它掃描txlist中的每一個epitem，調用其關聯fd對用的poll方法。以後將取得的events和相應的fd發送到用戶空間（封裝在struct epoll_event，從epoll_wait返回）。
(6) 若是這個epitem對應的fd是LT模式監聽且取得的events是用戶所關心的，則將其從新加入回rdlist。不然（ET模式）不在加入rdlist。性能

ET模式與LT模式的不一樣

ET和LT模式下的epitem均可以經過插入紅黑樹時的回調（ep_poll_callback）方式加入rdlist從而喚醒epoll_wait，但LT模式下的epitem還能夠經過txlist（ep_send_events）從新加入rdlist喚醒epoll_wait。因此ET模式下，fd就緒，只會被通知一次，而LT模式下只要知足相應讀寫條件就返回就緒（經過txlist加入rdlist）。spa