歸納來講,一個IO操做能夠分爲兩個部分:發出請求、結果完成。若是從發出請求到結果返回,一直Block,那就是Blocking IO;若是發出請求就能夠返回(結果完成不考慮),就是non-blocking IO;若是發出請求就返回,結果返回是Block在select或者poll上的,則其只能稱爲IO multiplexing;若是發出請求就返回,結果返回經過Call Back的方式被處理,就是AIO。java
文[2]中圖畫的不錯,說的也比較清楚借來用一下。windows
Blocking IO設計模式
這個最好理解了,在Blocking IO模式下,函數調用只有在操做完成後纔會返回。下圖是它調用過程的圖示:服務器
重點解釋下上圖,下面例子都會講到。首先application調用 recvfrom()轉入kernel,注意kernel有2個過程,wait for data和copy data from kernel to user。直到最後copy complete後,recvfrom()才返回。此過程一直是阻塞的。數據結構
Non-Blocking IO app
Non-Blocking 是Blocking的反,也就是說,即便操做沒有完成,函數也能夠返回。調用過程以下:異步
能夠看見,若是直接操做它,那就是個輪詢。。直到內核緩衝區有數據async
AIO也是這樣啊?對!這是Non-Blocking IO 和AIO的共同點。其實從概念層面來講Non-Blocking IO 就是AIO,他們沒有什麼區別。可是Non-Blocking IO是對文件描述符(*nix)或者Handle(Windows)的設置,在執行操做時不須要特殊的數據結構。Non-Blocking IO提交請求後只能經過提交的操做函數來查詢操做是否完成,這是一個很大的限制。而AIO每每會提供多種通知或者查詢機制,也就是說用Non-Blocking IO時只能輪詢,而AIO有更多選擇。因此是否支持輪詢外的其餘機制是AIO和Non-Blocking IO的區別。ide
Non-Blocking IO和Blocking IO的區別僅僅在操做是否可以馬上完成,若是可以馬上完成,IO函數的行爲是同樣的;若是不能馬上完成,Non-Blocking IO會返回EAGAIN或者EWOULDBLOCK,而Blocking IO會一直阻塞。
I/O multiplexing (select and poll)
最多見的I/O複用模型,select。
select先阻塞,有活動套接字才返回。與blocking I/O相比,select會有兩次系統調用,可是select能處理多個套接字。
signal driven I/O (SIGIO)
只有UNIX系統支持,感興趣的課查閱相關資料
與I/O multiplexing (select and poll)相比,它的優點是,免去了select的阻塞與輪詢,當有活躍套接字時,由註冊的handler處理。
Asynchronous I/O (the POSIX aio_functions)
不多有*nix系統支持,windows的IOCP則是此模型。
The POSIX asynchronous I/O (AIO) interface allows applications to initiate one or more I/O operations that are performed asynchronously (i.e., in the background). The application can elect to be notified of completion of the I/O operation in a variety of ways: by delivery of a signal, by instantiation of a thread, or no notification at all.
AIO讓應用發起一個操做請求,讓這個請求被異步地執行。應用能夠選擇在操做完成時被通知到或者不被通知。因此通知機制並非AIO的核心,可是須要提供幾種選擇。在Windows上,Overlapped IO是AIO的實現,IOCP在Overlapped IO的基礎上提供了高效的通知機制。
徹底異步的I/O複用機制,由於縱觀上面其它四種模型,至少都會在由kernel copy data to application時阻塞。而該模型是當copy完成後才通知application,可見是純異步的。好像只有windows的完成端口是這個模型,效率也很出色。
下面是以上五種模型的比較
能夠看出,越日後,阻塞越少,理論上效率也是最優。
下面能夠把select,epoll,iocp,kqueue按號入座。
select和iocp分別對應第3種與第5種模型,那麼epoll與kqueue呢?其實也於select屬於同一種模型,只是更高級一些,能夠看做有了第4種模型的某些特性,如callback機制。
那麼,爲何epoll,kqueue比select高級?
答案是,他們無輪詢。由於他們用callback取代了。想一想看,當套接字比較多的時候,每次select()都要經過遍歷FD_SETSIZE個Socket來完成調度,無論哪一個Socket是活躍的,都遍歷一遍。這會浪費不少CPU時間。若是能給套接字註冊某個回調函數,當他們活躍時,自動完成相關操做,那就避免了輪詢,這正是epoll與kqueue作的。
windows or *nix (IOCP or kqueue/epoll)?
誠然,Windows的IOCP很是出色,目前不多有支持asynchronous I/O的系統,可是因爲其系統自己的侷限性,大型服務器仍是在UNIX下。並且正如上面所述,kqueue/epoll 與 IOCP相比,就是多了一層從內核copy數據到應用層的阻塞,從而不能算做asynchronous I/O類。可是,這層小小的阻塞無足輕重,kqueue與epoll已經作得很優秀了。
提供一致的接口,IO Design Patterns
實際上,不論是哪一種模型,均可以抽象一層出來,提供一致的接口,廣爲人知的有ACE,Libevent這些,他們都是跨平臺的,並且他們自動選擇最優的I/O複用機制,用戶只需調用接口便可。說到這裏又得說說2個設計模式,Reactor and Proactor。有一篇經典文章http://www.artima.com/articles/io_design_patterns.html值得閱讀,Libevent是Reactor模型,ACE提供Proactor模型。實際都是對各類I/O複用機制的封裝。
Java nio包是什麼I/O機制?
我曾天真的認爲java nio封裝的是IOCP。。如今能夠肯定,目前的java本質是select()模型,能夠檢查/jre/bin/nio.dll得知。至於java服務器爲何效率還不錯。。我也不得而知,多是設計得比較好吧。。-_-。
=====================分割線==================================
總結一些重點:
只有IOCP是asynchronous I/O,其餘機制或多或少都會有一點阻塞。 select低效是由於每次它都須要輪詢。但低效也是相對的,視狀況而定,也可經過良好的設計改善 epoll, kqueue是Reacor模式,IOCP是Proactor模式。 java nio包是select模型。。
Reference:
1. http://www.artima.com/articles/io_design_patterns.html
2. http://hi.baidu.com/ailuoli/blog/item/f9fe370f0dee7bf1ab6457e7.html