阻塞和非阻塞通訊

同步、異步、阻塞和非阻塞是幾種基本的sockets調用方式,也是在進行網絡編程時須要理解和區分的基本概念之一。關於這方面的文章和討論至關豐富,這裏着重討論其中兩個比較容易混淆的兩個,即非阻塞與異步的關係。 java

先仍是簡單所列一下幾中調用方式的常看法釋: 程序員

同步:函數沒有執行完不返回,線程被掛起; 編程

阻塞:沒有收完數據函數不返回,線程也被掛起; 服務器

異步:函數當即返回,經過事件或是信號通知調用者; 網絡

非阻塞:函數當即返回,經過select通知調用者 架構

同步和阻塞是比較容易弄明白其含義的,但在實際編程過程當中,異步與非阻塞的概念卻並不能直觀地區分於「經過事件或是信號通知調用者」與「經過select通知調用者」這種字面解釋。 併發

 

阻塞通訊意味着通訊方法在嘗試訪問套接字或者讀寫數據時阻塞了對套接字的訪問。在 JDK 1.4 以前,繞過 阻塞限制的方法是無限制地使用線程,但這樣經常會形成大量的線程開銷,對系統的性能和可伸縮性產生影響。java.nio 包改變了這種情況,容許服務器有效地使用 I/O 流,在合理的時間內處理所服務的客戶請求。 異步

 


沒有非阻塞通訊,這個過程就像我所喜歡說的「隨心所欲」那樣。基本上,這個過程就是發送和讀取任何可以發送/讀取的東西。若是沒有能夠讀取 的東西,它就停止讀操做,作其餘的事情直到可以讀取爲止。當發送數據時,該過程將試圖發送全部的數據,但返回實際發送出的內容。多是所有數據、部分數據 或者根本沒有發送數據。 socket

 


阻塞與非阻塞相比確實有一些優勢,特別是遇到錯誤控制問題的時候。在阻塞套接字通訊中,若是出現錯誤,該訪問會自動返回標誌錯誤的代碼。錯 誤多是因爲網絡超時、套接字關閉或者任何類型的 I/O 錯誤形成的。在非阻塞套接字通訊中,該方法可以處理的惟一錯誤是網絡超時。爲了檢測使用非阻塞通訊的網絡超時,須要編寫稍微多一點的代碼,以肯定自從上一 次收到數據以來已經多長時間了。 ide

 


哪一種方式更好取決於應用程序。若是使用的是同步通訊,若是數據沒必要在讀取任何數據以前處理的話,阻塞通訊更好一些,而非阻塞通訊則提供了處理任何已經讀取的數據的機會。而異步通訊,如 IRC 和聊天客戶機則要求非阻塞通訊以免凍結套接字。

 

Java中的阻塞和非阻塞IO包各自的優劣思考

 


NIO 設計背後的基石:反應器模式,用於事件多路分離和分派的體系結構模式。

反應器(Reactor):用於事件多路分離和分派的體系結構模式

 

一般的,對一個文件描述符指定的文件或設備, 有兩種工做方式: 阻塞 與非阻塞 。所謂阻塞方式的意思是指, 當試圖對該文件描述符進行讀寫時, 若是當時沒有東西可讀,或者暫時不可寫, 程序就進入等待 狀態, 直到有東西可讀或者可寫爲止。而對於非阻塞狀態, 若是沒有東西可讀, 或者不可寫, 讀寫函數立刻返回, 而不會等待 。

 

一種經常使用作法是:每創建一個Socket鏈接時,同時建立一個新線程對該Socket進行單獨通訊(採用阻塞的方式通訊)。這種方式具備很高的響應 速度,而且控制起來也很簡單,在鏈接數較少的時候很是有效,可是若是對每個鏈接都產生一個線程的無疑是對系統資源的一種浪費,若是鏈接數較多將會出現資 源不足的狀況。

 

另外一種較高效的作法是:服務器端保存一個Socket鏈接列表,而後對這個列表進行輪詢,若是發現某個Socket端口上有數據可讀時(讀就緒), 則調用該socket鏈接的相應讀操做;若是發現某個 Socket端口上有數據可寫時(寫就緒),則調用該socket鏈接的相應寫操做;若是某個端口的Socket鏈接已經中斷,則調用相應的析構方法關閉 該端口。這樣能充分利用服務器資源,效率獲得了很大提升。

 

傳統的阻塞式IO,每一個鏈接必需要開一個線程來處理,而且沒處理完線程不能退出。

 

非阻塞式IO,因爲基於反應器模式,用於事件多路分離和分派的體系結構模式,因此能夠利用線程池來處理。事件來了就處理,處理完了就把線程歸還。而 傳統阻塞方式不能使用線程池來處理,假設當前有10000個鏈接,非阻塞方式可能用1000個線程的線程池就搞定了,而傳統阻塞方式就須要開10000個 來處理。若是鏈接數較多將會出現資源不足的狀況。非阻塞的核心優點就在這裏。

 

爲何會這樣,下面就對他們作進一步細緻具體的分析:

 

首先,咱們來分析傳統阻塞式IO的瓶頸在哪裏。在鏈接數很少的狀況下,傳統IO編寫容易方便使用。可是隨着鏈接數的增多,問題傳統IO就不行了。因 爲前面說過,傳統IO處理每一個鏈接都要消耗 一個線程,而程序的效率當線程數很少時是隨着線程數的增長而增長,可是到必定的數量以後,是隨着線程數的增長而減小。這裏咱們得出結論,傳統阻塞式IO的 瓶頸在於不能處理過多的鏈接。

 

而後,非阻塞式IO的出現的目的就是爲了解決這個瓶頸。而非阻塞式IO是怎麼實現的呢?非阻塞IO處理鏈接的線程數和鏈接數沒有聯繫,也就是說處理 10000個鏈接非阻塞IO不須要10000個線程,你能夠用1000個也能夠用2000個線程來處理。由於非阻塞IO處理鏈接是異步的。當某個鏈接發送 請求到服務器,服務器把這個鏈接請求看成一個請求"事件",並把這個"事件"分配給相應的函數處理。咱們能夠把這個處理函數放到線程中去執行,執行完就把 線程歸還。這樣一個線程就能夠異步的處理多個事件。而阻塞式IO的線程的大部分時間都浪費在等待請求上了。

 

轉載聲明: 本文轉自 http://blog.csdn.net/liuzhengkang/archive/2008/12/20/3562115.aspx

 

===========================================================================

 

非阻塞 Socoket 編程

 

在互聯網至關普及的今天,在互聯網上聊天對不少「網蟲」來講已是家常便 飯了。聊天室程序能夠說是網上最簡單的多點通訊程序。聊天室的實現方法有不少,但都是利用所謂的「多用戶空間」來對信息進行交換,具備典型的多路I/O的 架構。一個簡單的聊天室, 從程序員的觀點來看就是在多個I/O端點之間實現多對多的通訊。其架構如圖一所示。這樣的實如今用戶的眼裏就是聊天室內任何一我的輸入一段字符以後,其餘 用戶均可以獲得這一句話。這種「多用戶空間」的架構在其餘多點通訊程序中應用的很是普遍,其核心就是多路I/O通訊。多路I/O通訊又被稱爲I/O多路復 用(I/OMultiplexing)通常被使用在如下的場合:

客戶程序須要同時處理交互式的輸入和同服務器之間的網絡鏈接時須要處理I/O多路複用問題;

客戶端須要同時對多個網絡鏈接做出反應(這種狀況不多見);

TCP服務器須要同時處理處於監聽狀態和多個鏈接狀態的socket;

服務器須要處理多個網絡協議的socket;

服務器須要同時處理不一樣的網絡服務和協議。

聊 天室所須要面對的狀況正是第一和第三兩種狀況。咱們將經過在TCP/IP協議之上創建一個功能簡單的聊天室讓你們更加了解多路I/O以及它的實現方法。我 們要討論的聊天室功能很是簡單, 感興趣的朋友能夠將其功能擴展, 發展成一個功能比較完整的聊天室, 如加上用戶認證, 用戶暱稱, 祕密信息, semote 等功能.

首先它是一個 client/server 結構的程序, 首先啓動 server, 而後用戶使用 client進行鏈接. client/server 結構的優勢是速度快, 缺點是當 server 進行更新時,client 也必需更新.

網絡初始化

首先是初始化 server, 使server 進入監聽狀態: (爲了簡潔起見,如下引用的程序與實際程序略有出入, 下同)

sockfd = socket( AF_INET,SOCK_STREAM, 0);
// 首先創建一個 socket, 族爲 AF_INET, 類型爲 SOCK_STREAM.
// AF_INET = ARPA Internet protocols 即便用 TCP/IP 協議族
// SOCK_STREAM 類型提供了順序的, 可靠的, 基於字節流的全雙工鏈接.
// 因爲該協議族中只有一個協議, 所以第三個參數爲 0

bind( sockfd, ( struct sockaddr *)&serv_addr, sizeof( serv_addr));
// 再將這個 socket 與某個地址進行綁定.
// serv_addr 包括 sin_family = AF_INET 協議族同 socket
// sin_addr.s_addr = htonl( INADDR_ANY) server 所接受的全部其餘
// 地址請求創建的鏈接.
// sin_port = htons( SERV_TCP_PORT) server 所監聽的端口
// 在本程序中, server 的 IP和監聽的端口都存放在 config 文件中.

listen( sockfd, MAX_CLIENT);
// 地址綁定以後, server 進入監聽狀態.
// MAX_CLIENT 是能夠同時創建鏈接的 client 總數.

server 進入 listen 狀態後, 等待 client 創建鏈接。

Client端要創建鏈接首先也須要初始化鏈接:

sockfd = socket( AF_INET,SOCK_STREAM,0));
// 一樣的, client 也先創建一個 socket, 其參數與 server 相同.

connect( sockfd, ( struct sockaddr *)&serv_addr, sizeof( serv_addr));

// client 使用 connect 創建一個鏈接.
// serv_addr 中的變量分別設置爲:
// sin_family = AF_INET 協議族同 socket
// sin_addr.s_addr = inet_addr( SERV_HOST_ADDR) 地址爲 server
// 所在的計算機的地址.
// sin_port = htons( SERV_TCP_PORT) 端口爲 server 監聽的端口.

當 client 創建新鏈接的請求被送到Server端時, server 使用 accept 來接受該
鏈接:

accept( sockfd, (struct sockaddr*)&cli_addr, &cli_len);
// 在函數返回時, cli_addr 中保留的是該鏈接對方的信息
// 包括對方的 IP 地址和對方使用的端口.
// accept 返回一個新的文件描述符.

在 server 進入 listen 狀態以後, 因爲已有多個用戶在線,因此程序須要同時對這些用戶進行操做,並在它們之間實現信息交換。這在實現上稱爲I/O多路複用技術。多路複用通常有如下幾種方法:

非阻塞通訊方法:將文件管道經過fcntl()設爲非阻塞通訊方式,每隔一端時間對他們實行一次輪詢,以判斷是否能夠進行讀寫操做。這種方式的缺點是費用過高,大部分資源浪費在輪詢上。

子進程方法:應用多個子進程,每個對一個單工阻塞方式通訊。全部子進程經過IPC和父進程進行通訊。父進程掌管全部信息。這種方式的缺點是實現複雜,並且因爲IPC在各個操做系統平臺上並不徹底一致,會致使可移植性下降。

信號驅動(SIGIO)的異步I/O方法:首先,異步I/O是基於信號機制的,並不可靠。其次單一的信號不足以提供更多的信息來源。仍是須要輔助以其餘的手段,實現上有很高的難度。

select ()方法:在BSD中提供了一種能夠對多路I/O進行阻塞式查詢的方法——select()。它提供同時對多個I/O描述符進行阻塞式查詢的方法,利用 它,咱們能夠很方便的實現多路複用。根據統一UNIX規範的協議,POSIX也採用了這種方法,所以,咱們能夠在大多數操做系統中使用select方法。

使用專門的I/O多路複用器:在「UNIX? SYSTEM V Programmer's Guide: STREAMS」一書中詳細的說明了構造和使用多路複用器的方法。這裏就再也不詳述了。

咱們下面分別討論多路I/O的兩種實現方法:

1. 非阻塞通訊方法

對 一個文件描述符指定的文件或設備, 有兩種工做方式: 阻塞與非阻塞。所謂阻塞方式的意思是指, 當試圖對該文件描述符進行讀寫時, 若是當時沒有東西可讀,或者暫時不可寫, 程序就進入等待狀態, 直到有東西可讀或者可寫爲止。而對於非阻塞狀態, 若是沒有東西可讀, 或者不可寫, 讀寫函數立刻返回, 而不會等待。缺省狀況下, 文件描述符處於阻塞狀態。在實現聊天室時, server 須要輪流查詢與各client 創建的 socket,一旦可讀就將該 socket 中的字符讀出來並向全部其餘client 發送。而且, server 還要隨時查看是否有新的 client 試圖創建鏈接,這樣, 若是 server 在任何一個地方阻塞了, 其餘client 發送的內容就會受到影響,得不到服務器的及時響應。新 client試圖創建鏈接也會受到影響。因此咱們在這裏不能使用缺省的阻塞的文件工做方式,而須要將文件的工做方式變成非阻塞方式。在UNIX下,函數 fcntl()能夠用來改變文件I/O操做的工做方式,函數描述以下:

fcntl( sockfd, F_SETFL, O_NONBLOCK);
// sockfd 是要改變狀態的文件描述符.
// F_SETFL 代表要改變文件描述符的狀態
// O_NONBLOCK 表示將文件描述符變爲非阻塞的.

爲了節省篇幅咱們使用天然語言描述聊天室 server :

while ( 1)

    if 有新鏈接 then 創建並記錄該新鏈接;
    for ( 全部的有效鏈接)
    begin
        if 該鏈接中有字符可讀 then
        begin
        讀入字符串;
            for ( 全部其餘的有效鏈接)
            begin
            將該字符串發送給該鏈接;
            end;
        end;
    end;
end.


因爲判斷是否有新鏈接, 是否可讀都是非阻塞的, 所以每次判斷,無論有仍是沒有, 都會立刻返回. 這樣,任何一個 client 向 server 發送字符或者試圖創建新鏈接,都不會對其餘 client 的活動形成影響。

對 client 而言, 創建鏈接以後, 只須要處理兩個文件描述符, 一個是創建了鏈接的socket 描述符, 另外一個是標準輸入. 和 server 同樣, 若是使用阻塞方式的話,很容易由於其中一個暫時沒有輸入而影響另一個的讀入.. 所以將它們都變成非阻塞的,而後client 進行以下動做:

while ( 不想退出)
begin
    if ( 與 server 的鏈接有字符可讀)
    begin
   
從該鏈接讀入, 並輸出到標準輸出上去.
    End;
    if ( 標準輸入可讀)
    Begin
    從標準輸入讀入, 並輸出到與 server 的鏈接中去.
   
End;
End.

上面的讀寫分別調用這樣兩個函數:

read( userfd[i], line, MAX_LINE);
// userfd[i] 是指第 i 個 client 鏈接的文件描述符.
// line 是指讀出的字符存放的位置.
// MAX_LINE 是一次最多讀出的字符數.
// 返回值是實際讀出的字符數.

write( userfd[j], line, strlen( line));
// userfd[j] 是第 j 個 client 的文件描述符.
// line 是要發送的字符串.
// strlen( line) 是要發送的字符串長度.

分 析上面的程序能夠知道, 無論是 server 仍是 client, 它們都不停的輪流查詢各個文件描述符, 一旦可讀就讀入並進行處理. 這樣的程序, 不停的在執行, 只要有CPU 資源, 就不會放過。所以對系統資源的消耗很是大。server 或者 client 單獨執行時,CPU 資源的 98% 左右都被其佔用。極大的消耗了系統資源。

select 方法所以,雖然咱們不但願在某一個用戶沒有反應時阻塞其餘的用戶,但咱們卻應該在沒有任何用戶有反應的狀況之下中止程序的運行,讓出搶佔的系統資源,進入阻塞狀態。有沒有這種方法呢?如今的UNIX系統中都提供了select方法,具體實現方式以下:

select 方法中, 全部文件描述符都是阻塞的. 使用 select 判斷一組文件描述符中是否有一個可讀(寫), 若是沒有就阻塞, 直到有一個的時候就被喚醒. 咱們先看比較簡單的 client 的實現:

因爲 client 只須要處理兩個文件描述符, 所以, 須要判斷是否有可讀寫的文件描述符只須要加入兩項:

FD_ZERO( sockset);
// 將 sockset 清空
FD_SET( sockfd, sockset);
// 把 sockfd 加入到 sockset 集合中
FD_SET( 0, sockset);
// 把 0 (標準輸入) 加入到 sockset 集合中

而後 client 的處理以下:

while ( 不想退出)

select( sockfd+1, &sockset, NULL, NULL, NULL);
// 此時該函數將阻塞直到標準輸入或者 sockfd 中有一個可讀爲止
// 第一個參數是 0 和 sockfd 中的最大值加一
// 第二個參數是 讀集, 也就是 sockset
// 第三, 四個參數是寫集和異常集, 在本程序中都爲空
// 第五個參數是超時時間, 即在指定時間內仍沒有可讀, 則出錯
// 並返回. 當這個參數爲NULL 時, 超時時間被設置爲無限長.
// 當 select 由於可讀返回時, sockset 中包含的只是可讀的
// 那些文件描述符.
if ( FD_ISSET( sockfd, &sockset))

// FD_ISSET 這個宏判斷 sockfd 是否屬於可讀的文件描述符
從 sockfd 中讀入, 輸出到標準輸出上去.
}

if ( FD_ISSET( 0, &sockset))

// FD_ISSET 這個宏判斷 sockfd 是否屬於可讀的文件描述符
從標準輸入讀入, 輸出到 sockfd 中去.
}
從新設置 sockset. (即將 sockset 清空, 並將 sockfd 和 0 加入)
}

下面看 server 的狀況:

設置 sockset 以下:

FD_ZERO( sockset);
FD_SET( sockfd, sockset);
for ( 全部有效鏈接)
FD_SET( userfd[i], sockset);
}
maxfd = 最大的文件描述符號 + 1;

server 處理以下:

while ( 1)

select( maxfd, &sockset, NULL, NULL, NULL);
if ( FD_ISSET( sockfd, &sockset))

// 有新鏈接
創建新鏈接, 並將該鏈接描述符加入到 sockset 中去了.
}
for ( 全部有效鏈接)

if ( FD_ISSET ( userfd[i], &sockset))

// 該鏈接中有字符可讀
從該鏈接中讀入字符, 併發送到其餘有效鏈接中去.
}

}
從新設置 sockset;
}
性能比較 由 於採用 select 機制, 所以當沒有字符可讀時, 程序處於阻塞狀態,最小程度的佔用CPU 資源, 在同一臺機器上執行一個 server 和若干個client 時, 系統負載只有0.1左右, 而採用原來的非阻塞通訊方法, 只運行一個 server, 系統負載就能夠達到1.5左右. 所以咱們推薦使用 select. 參考文獻: [1] UNIX Network Programming Volume 1 W.Richard Stevens 1998 Prentice Hall [2] 計算機實用網絡編程 湯毅堅 1993 人民郵電出版社 [3] UNIX? SYSTEM V RELEASE 4 Programmer's Guide:STREAMS AT&T 1990 Prentice Hall [4] UNIX? SYSTEM V RELEASE 4 Network Programmer's Guide AT&T 1990 Prentice Hall 全部源程序均登載在eDOC網站上,若有須要能夠去http://edoc.163.net下載
相關文章
相關標籤/搜索