使用異步 I/O 大大提升應用程序的性能

使用異步 I/O 大大提升應用程序的性能

學習什麼時候以及如何使用 POSIX AIO API網絡

Linux® 中最經常使用的輸入/輸出(I/O)模型是同步 I/O。在這個模型中,當請求發出以後,應用程序就會阻塞,直到請求知足爲止。這是很好的一種解決方案,由於調用應用程序在等待 I/O 請求完成時不須要使用任何中央處理單元(CPU)。可是在某些狀況中,I/O 請求可能須要與其餘進程產生交疊。可移植操做系統接口(POSIX)異步 I/O(AIO)應用程序接口(API)就提供了這種功能。在本文中,咱們將對這個 API 概要進行介紹,並來了解一下如何使用它。架構

M. Tim Jones (mtj@mtjones.com), 顧問工程師, Emulex異步

M. Tim JonesTim Jones 是一名嵌入式軟件工程師,他是 GNU/Linux Application ProgrammingAI Application Programming 以及 BSD Sockets Programming from a Multilanguage Perspective 等書的做者。他的工程背景很是普遍,從同步宇宙飛船的內核開發到嵌入式架構設計,再到網絡協議的開發。Tim 是 Emulex Corp. 的一名資深軟件工程師。函數

developerWorks 投稿做者

2006 年 9 月 28 日性能

AIO 簡介

Linux 異步 I/O 是 Linux 內核中提供的一個至關新的加強。它是 2.6 版本內核的一個標準特性,可是咱們在 2.4 版本內核的補丁中也能夠找到它。AIO 背後的基本思想是容許進程發起不少 I/O 操做,而不用阻塞或等待任何操做完成。稍後或在接收到 I/O 操做完成的通知時,進程就能夠檢索 I/O 操做的結果。學習

I/O 模型

在深刻介紹 AIO API 以前,讓咱們先來探索一下 Linux 上可使用的不一樣 I/O 模型。這並非一個詳盡的介紹,可是咱們將試圖介紹最經常使用的一些模型來解釋它們與異步 I/O 之間的區別。圖 1 給出了同步和異步模型,以及阻塞和非阻塞的模型。優化

    圖 1. 基本 Linux I/O 模型的簡單矩陣
基本 Linux I/O 模型的簡單矩陣

每一個 I/O 模型都有本身的使用模式,它們對於特定的應用程序都有本身的優勢。本節將簡要對其一一進行介紹。this

同步阻塞 I/O

I/O 密集型與 CPU 密集型進程的比較

I/O 密集型進程所執行的 I/O 操做比執行的處理操做更多。CPU 密集型的進程所執行的處理操做比 I/O 操做更多。Linux 2.6 的調度器實際上更加偏心 I/O 密集型的進程,由於它們一般會發起一個 I/O 操做,而後進行阻塞,這就意味着其餘工做均可以在二者之間有效地交錯進行。

最經常使用的一個模型是同步阻塞 I/O 模型。在這個模型中,用戶空間的應用程序執行一個系統調用,這會致使應用程序阻塞。這意味着應用程序會一直阻塞,直到系統調用完成爲止(數據傳輸完成或發生錯誤)。調用應用程序處於一種再也不消費 CPU 而只是簡單等待響應的狀態,所以從處理的角度來看,這是很是有效的。

圖 2 給出了傳統的阻塞 I/O 模型,這也是目前應用程序中最爲經常使用的一種模型。其行爲很是容易理解,其用法對於典型的應用程序來講都很是有效。在調用read 系統調用時,應用程序會阻塞並對內核進行上下文切換。而後會觸發讀操做,當響應返回時(從咱們正在從中讀取的設備中返回),數據就被移動到用戶空間的緩衝區中。而後應用程序就會解除阻塞(read 調用返回)。

    圖 2. 同步阻塞 I/O 模型的典型流程
同步阻塞 I/O 模型的典型流程

從應用程序的角度來講,read 調用會延續很長時間。實際上,在內核執行讀操做和其餘工做時,應用程序的確會被阻塞。

同步非阻塞 I/O

同步阻塞 I/O 的一種效率稍低的變種是同步非阻塞 I/O。在這種模型中,設備是以非阻塞的形式打開的。這意味着 I/O 操做不會當即完成,read 操做可能會返回一個錯誤代碼,說明這個命令不能當即知足(EAGAINEWOULDBLOCK),如圖 3 所示。

    圖 3. 同步非阻塞 I/O 模型的典型流程
同步非阻塞 I/O 模型的典型流程

非阻塞的實現是 I/O 命令可能並不會當即知足,須要應用程序調用許屢次來等待操做完成。這可能效率不高,由於在不少狀況下,當內核執行這個命令時,應用程序必需要進行忙碌等待,直到數據可用爲止,或者試圖執行其餘工做。正如圖 3 所示的同樣,這個方法能夠引入 I/O  操做的延時,由於數據在內核中變爲可用到用戶調用 read 返回數據之間存在必定的間隔,這會致使總體數據吞吐量的下降。

異步阻塞 I/O

另一個阻塞解決方案是帶有阻塞通知的非阻塞 I/O。在這種模型中,配置的是非阻塞 I/O,而後使用阻塞 select 系統調用來肯定一個 I/O 描述符什麼時候有操做。使 select 調用很是有趣的是它能夠用來爲多個描述符提供通知,而不只僅爲一個描述符提供通知。對於每一個提示符來講,咱們能夠請求這個描述符能夠寫數據、有讀數據可用以及是否發生錯誤的通知。

    圖 4. 異步阻塞 I/O 模型的典型流程     (select)
異步阻塞 I/O 模型的典型流程

select 調用的主要問題是它的效率不是很是高。儘管這是異步通知使用的一種方便模型,可是對於高性能的 I/O 操做來講不建議使用。

異步非阻塞 I/O(AIO)

最後,異步非阻塞 I/O 模型是一種處理與 I/O 重疊進行的模型。讀請求會當即返回,說明 read 請求已經成功發起了。在後臺完成讀操做時,應用程序而後會執行其餘處理操做。當 read 的響應到達時,就會產生一個信號或執行一個基於線程的回調函數來完成此次 I/O 處理過程。

    圖 5. 異步非阻塞 I/O 模型的典型流程
異步非阻塞 I/O 模型的典型流程

在一個進程中爲了執行多個 I/O 請求而對計算操做和 I/O 處理進行重疊處理的能力利用了處理速度與 I/O 速度之間的差別。當一個或多個 I/O 請求掛起時,CPU 能夠執行其餘任務;或者更爲常見的是,在發起其餘 I/O 的同時對已經完成的 I/O 進行操做。

下一節將深刻介紹這種模型,探索這種模型使用的 API,而後展現幾個命令。


異步 I/O 的動機

從前面 I/O 模型的分類中,咱們能夠看出 AIO 的動機。這種阻塞模型須要在 I/O 操做開始時阻塞應用程序。這意味着不可能同時重疊進行處理和 I/O 操做。同步非阻塞模型容許處理和 I/O 操做重疊進行,可是這須要應用程序根據重現的規則來檢查 I/O 操做的狀態。這樣就剩下異步非阻塞 I/O 了,它容許處理和 I/O 操做重疊進行,包括 I/O 操做完成的通知。

除了須要阻塞以外,select 函數所提供的功能(異步阻塞 I/O)與 AIO 相似。不過,它是對通知事件進行阻塞,而不是對 I/O 調用進行阻塞。


Linux 上的 AIO 簡介

本節將探索 Linux 的異步 I/O 模型,從而幫助咱們理解如何在應用程序中使用這種技術。

在傳統的 I/O 模型中,有一個使用唯一句柄標識的 I/O 通道。在 UNIX® 中,這些句柄是文件描述符(這對等同於文件、管道、套接字等等)。在阻塞 I/O 中,咱們發起了一次傳輸操做,當傳輸操做完成或發生錯誤時,系統調用就會返回。

Linux 上的 AIO

AIO 在 2.5 版本的內核中首次出現,如今已是 2.6 版本的產品內核的一個標準特性了。

在異步非阻塞 I/O 中,咱們能夠同時發起多個傳輸操做。這須要每一個傳輸操做都有唯一的上下文,這樣咱們才能在它們完成時區分究竟是哪一個傳輸操做完成了。在 AIO 中,這是一個 aiocb(AIO I/O Control Block)結構。這個結構包含了有關傳輸的全部信息,包括爲數據準備的用戶緩衝區。在產生 I/O (稱爲完成)通知時,aiocb 結構就被用來唯一標識所完成的 I/O 操做。這個 API 的展現顯示瞭如何使用它。


AIO API

AIO 接口的 API 很是簡單,可是它爲數據傳輸提供了必需的功能,並給出了兩個不一樣的通知模型。表 1 給出了 AIO 的接口函數,本節稍後會更詳細進行介紹。

表 1. AIO 接口 API
API 函數 說明
aio_read 請求異步讀操做
aio_error 檢查異步請求的狀態
aio_return 得到完成的異步請求的返回狀態
aio_write 請求異步寫操做
aio_suspend 掛起調用進程,直到一個或多個異步請求已經完成(或失敗)
aio_cancel 取消異步 I/O 請求
lio_listio 發起一系列 I/O 操做

每一個 API 函數都使用 aiocb 結構開始或檢查。這個結構有不少元素,可是清單 1 僅僅給出了須要(或能夠)使用的元素。

清單 1. aiocb 結構中相關的域
struct aiocb {

  int aio_fildes;               // File Descriptor
  int aio_lio_opcode;           // Valid only for lio_listio (r/w/nop)
  volatile void *aio_buf;       // Data Buffer
  size_t aio_nbytes;            // Number of Bytes in Data Buffer
  struct sigevent aio_sigevent; // Notification Structure

  /* Internal fields */
  ...

};

sigevent 結構告訴 AIO 在 I/O 操做完成時應該執行什麼操做。咱們將在 AIO 的展現中對這個結構進行探索。如今咱們將展現各個 AIO 的 API 函數是如何工做的,以及咱們應該如何使用它們。

aio_read

aio_read 函數請求對一個有效的文件描述符進行異步讀操做。這個文件描述符能夠表示一個文件、套接字甚至管道。aio_read 函數的原型以下:

int aio_read( struct aiocb *aiocbp );

aio_read 函數在請求進行排隊以後會當即返回。若是執行成功,返回值就爲 0;若是出現錯誤,返回值就爲 -1,並設置 errno 的值。

要執行讀操做,應用程序必須對 aiocb 結構進行初始化。下面這個簡短的例子就展現瞭如何填充 aiocb 請求結構,並使用 aio_read 來執行異步讀請求(如今暫時忽略通知)操做。它還展現了 aio_error 的用法,不過咱們將稍後再做解釋。

清單 2. 使用 aio_read 進行異步讀操做的例子
#include <aio.h>

...

  int fd, ret;
  struct aiocb my_aiocb;

  fd = open( "file.txt", O_RDONLY );
  if (fd < 0) perror("open");

  /* Zero out the aiocb structure (recommended) */
  bzero( (char *)&my_aiocb, sizeof(struct aiocb) );

  /* Allocate a data buffer for the aiocb request */
  my_aiocb.aio_buf = malloc(BUFSIZE+1);
  if (!my_aiocb.aio_buf) perror("malloc");

  /* Initialize the necessary fields in the aiocb */
  my_aiocb.aio_fildes = fd;
  my_aiocb.aio_nbytes = BUFSIZE;
  my_aiocb.aio_offset = 0;

  ret = aio_read( &my_aiocb );
  if (ret < 0) perror("aio_read");

  while ( aio_error( &my_aiocb ) == EINPROGRESS ) ;

  if ((ret = aio_return( &my_iocb )) > 0) {
    /* got ret bytes on the read */
  } else {
    /* read failed, consult errno */
  }

在清單 2 中,在打開要從中讀取數據的文件以後,咱們就清空了 aiocb 結構,而後分配一個數據緩衝區。並將對這個數據緩衝區的引用放到 aio_buf 中。而後,咱們將 aio_nbytes 初始化成緩衝區的大小。並將 aio_offset 設置成 0(該文件中的第一個偏移量)。咱們將 aio_fildes 設置爲從中讀取數據的文件描述符。在設置這些域以後,就調用 aio_read 請求進行讀操做。咱們而後能夠調用 aio_error 來肯定 aio_read 的狀態。只要狀態是 EINPROGRESS,就一直忙碌等待,直到狀態發生變化爲止。如今,請求可能成功,也可能失敗。

使用 AIO 接口來編譯程序

咱們能夠在 aio.h 頭文件中找到函數原型和其餘須要的符號。在編譯使用這種接口的程序時,咱們必須使用 POSIX 實時擴展庫(librt)。

注意使用這個 API 與標準的庫函數從文件中讀取內容是很是類似的。除了 aio_read 的一些異步特性以外,另一個區別是讀操做偏移量的設置。在傳統的 read 調用中,偏移量是在文件描述符上下文中進行維護的。對於每一個讀操做來講,偏移量都須要進行更新,這樣後續的讀操做才能對下一塊數據進行尋址。對於異步 I/O 操做來講這是不可能的,由於咱們能夠同時執行不少讀請求,所以必須爲每一個特定的讀請求都指定偏移量。

aio_error

aio_error 函數被用來肯定請求的狀態。其原型以下:

int aio_error( struct aiocb *aiocbp );

這個函數能夠返回如下內容:

  • EINPROGRESS,說明請求還沒有完成
  • ECANCELLED,說明請求被應用程序取消了
  • -1,說明發生了錯誤,具體錯誤緣由能夠查閱 errno

aio_return

異步 I/O 和標準塊 I/O 之間的另一個區別是咱們不能當即訪問這個函數的返回狀態,由於咱們並無阻塞在 read 調用上。在標準的 read 調用中,返回狀態是在該函數返回時提供的。可是在異步 I/O 中,咱們要使用 aio_return 函數。這個函數的原型以下:

ssize_t aio_return( struct aiocb *aiocbp );

只有在 aio_error 調用肯定請求已經完成(可能成功,也可能發生了錯誤)以後,纔會調用這個函數。aio_return 的返回值就等價於同步狀況中 readwrite 系統調用的返回值(所傳輸的字節數,若是發生錯誤,返回值就爲 -1)。

aio_write

aio_write 函數用來請求一個異步寫操做。其函數原型以下:

int aio_write( struct aiocb *aiocbp );

aio_write 函數會當即返回,說明請求已經進行排隊(成功時返回值爲 0,失敗時返回值爲 -1,並相應地設置 errno)。

這與 read 系統調用相似,可是有一點不同的行爲須要注意。回想一下對於 read 調用來講,要使用的偏移量是很是重要的。然而,對於 write 來講,這個偏移量只有在沒有設置 O_APPEND 選項的文件上下文中才會很是重要。若是設置了  O_APPEND,那麼這個偏移量就會被忽略,數據都會被附加到文件的末尾。不然,aio_offset 域就肯定了數據在要寫入的文件中的偏移量。

aio_suspend

咱們可使用 aio_suspend 函數來掛起(或阻塞)調用進程,直到異步請求完成爲止,此時會產生一個信號,或者發生其餘超時操做。調用者提供了一個 aiocb 引用列表,其中任何一個完成都會致使 aio_suspend 返回。 aio_suspend 的函數原型以下:

int aio_suspend( const struct aiocb *const cblist[],
                  int n, const struct timespec *timeout );

aio_suspend 的使用很是簡單。咱們要提供一個 aiocb 引用列表。若是任何一個完成了,這個調用就會返回 0。不然就會返回 -1,說明發生了錯誤。請參看清單 3。

清單 3. 使用 aio_suspend 函數阻塞異步 I/O
struct aioct *cblist[MAX_LIST]

/* Clear the list. */
bzero( (char *)cblist, sizeof(cblist) );

/* Load one or more references into the list */
cblist[0] = &my_aiocb;

ret = aio_read( &my_aiocb );

ret = aio_suspend( cblist, MAX_LIST, NULL );

注意,aio_suspend 的第二個參數是 cblist 中元素的個數,而不是 aiocb 引用的個數。cblist 中任何 NULL元素都會被 aio_suspend 忽略。

若是爲 aio_suspend 提供了超時,而超時狀況的確發生了,那麼它就會返回 -1errno 中會包含 EAGAIN

aio_cancel

aio_cancel 函數容許咱們取消對某個文件描述符執行的一個或全部 I/O 請求。其原型以下:

int aio_cancel( int fd, struct aiocb *aiocbp );

要取消一個請求,咱們須要提供文件描述符和 aiocb 引用。若是這個請求被成功取消了,那麼這個函數就會返回 AIO_CANCELED。若是請求完成了,這個函數就會返回 AIO_NOTCANCELED

要取消對某個給定文件描述符的全部請求,咱們須要提供這個文件的描述符,以及一個對 aiocbpNULL 引用。若是全部的請求都取消了,這個函數就會返回 AIO_CANCELED;若是至少有一個請求沒有被取消,那麼這個函數就會返回 AIO_NOT_CANCELED;若是沒有一個請求能夠被取消,那麼這個函數就會返回 AIO_ALLDONE。咱們而後可使用 aio_error 來驗證每一個 AIO 請求。若是這個請求已經被取消了,那麼 aio_error 就會返回 -1,而且 errno 會被設置爲 ECANCELED

lio_listio

最後,AIO 提供了一種方法使用 lio_listio API 函數同時發起多個傳輸。這個函數很是重要,由於這意味着咱們能夠在一個系統調用(一次內核上下文切換)中啓動大量的 I/O 操做。從性能的角度來看,這很是重要,所以值得咱們花點時間探索一下。lio_listio API 函數的原型以下:

int lio_listio( int mode, struct aiocb *list[], int nent,
                   struct sigevent *sig );

mode 參數能夠是 LIO_WAITLIO_NOWAITLIO_WAIT 會阻塞這個調用,直到全部的 I/O 都完成爲止。在操做進行排隊以後,LIO_NOWAIT 就會返回。list 是一個 aiocb 引用的列表,最大元素的個數是由 nent 定義的。注意 list 的元素能夠爲 NULLlio_listio 會將其忽略。sigevent 引用定義了在全部 I/O 操做都完成時產生信號的方法。

對於 lio_listio 的請求與傳統的 readwrite 請求在必須指定的操做方面稍有不一樣,如清單 4 所示。

清單 4. 使用 lio_listio 函數發起一系列請求
struct aiocb aiocb1, aiocb2;
struct aiocb *list[MAX_LIST];

...

/* Prepare the first aiocb */
aiocb1.aio_fildes = fd;
aiocb1.aio_buf = malloc( BUFSIZE+1 );
aiocb1.aio_nbytes = BUFSIZE;
aiocb1.aio_offset = next_offset;
aiocb1.aio_lio_opcode = LIO_READ;

...

bzero( (char *)list, sizeof(list) );
list[0] = &aiocb1;
list[1] = &aiocb2;

ret = lio_listio( LIO_WAIT, list, MAX_LIST, NULL );

對於讀操做來講,aio_lio_opcode 域的值爲 LIO_READ。對於寫操做來講,咱們要使用 LIO_WRITE,不過 LIO_NOP 對於不執行操做來講也是有效的。


AIO 通知

如今咱們已經看過了可用的 AIO 函數,本節將深刻介紹對異步通知可使用的方法。咱們將經過信號和函數回調來探索異步函數的通知機制。

使用信號進行異步通知

使用信號進行進程間通訊(IPC)是 UNIX 中的一種傳統機制,AIO 也能夠支持這種機制。在這種範例中,應用程序須要定義信號處理程序,在產生指定的信號時就會調用這個處理程序。應用程序而後配置一個異步請求將在請求完成時產生一個信號。做爲信號上下文的一部分,特定的 aiocb 請求被提供用來記錄多個可能會出現的請求。清單 5 展現了這種通知方法。

清單 5. 使用信號做爲 AIO 請求的通知
void setup_io( ... )
{
  int fd;
  struct sigaction sig_act;
  struct aiocb my_aiocb;

  ...

  /* Set up the signal handler */
  sigemptyset(&sig_act.sa_mask);
  sig_act.sa_flags = SA_SIGINFO;
  sig_act.sa_sigaction = aio_completion_handler;


  /* Set up the AIO request */
  bzero( (char *)&my_aiocb, sizeof(struct aiocb) );
  my_aiocb.aio_fildes = fd;
  my_aiocb.aio_buf = malloc(BUF_SIZE+1);
  my_aiocb.aio_nbytes = BUF_SIZE;
  my_aiocb.aio_offset = next_offset;

  /* Link the AIO request with the Signal Handler */
  my_aiocb.aio_sigevent.sigev_notify = SIGEV_SIGNAL;
  my_aiocb.aio_sigevent.sigev_signo = SIGIO;
  my_aiocb.aio_sigevent.sigev_value.sival_ptr = &my_aiocb;

  /* Map the Signal to the Signal Handler */
  ret = sigaction( SIGIO, &sig_act, NULL );

  ...

  ret = aio_read( &my_aiocb );

}


void aio_completion_handler( int signo, siginfo_t *info, void *context )
{
  struct aiocb *req;


  /* Ensure it's our signal */
  if (info->si_signo == SIGIO) {

    req = (struct aiocb *)info->si_value.sival_ptr;

    /* Did the request complete? */
    if (aio_error( req ) == 0) {

      /* Request completed successfully, get the return status */
      ret = aio_return( req );

    }

  }

  return;
}

在清單 5 中,咱們在 aio_completion_handler 函數中設置信號處理程序來捕獲 SIGIO 信號。而後初始化 aio_sigevent 結構產生 SIGIO 信號來進行通知(這是經過 sigev_notify 中的 SIGEV_SIGNAL 定義來指定的)。當讀操做完成時,信號處理程序就從該信號的 si_value 結構中提取出 aiocb,並檢查錯誤狀態和返回狀態來肯定 I/O 操做是否完成。

對於性能來講,這個處理程序也是經過請求下一次異步傳輸而繼續進行 I/O 操做的理想地方。採用這種方式,在一次數據傳輸完成時,咱們就能夠當即開始下一次數據傳輸操做。

使用回調函數進行異步通知

另一種通知方式是系統回調函數。這種機制不會爲通知而產生一個信號,而是會調用用戶空間的一個函數來實現通知功能。咱們在 sigevent 結構中設置了對 aiocb 的引用,從而能夠唯一標識正在完成的特定請求。請參看清單 6。

清單 6. 對 AIO 請求使用線程回調通知
void setup_io( ... )
{
  int fd;
  struct aiocb my_aiocb;

  ...

  /* Set up the AIO request */
  bzero( (char *)&my_aiocb, sizeof(struct aiocb) );
  my_aiocb.aio_fildes = fd;
  my_aiocb.aio_buf = malloc(BUF_SIZE+1);
  my_aiocb.aio_nbytes = BUF_SIZE;
  my_aiocb.aio_offset = next_offset;

  /* Link the AIO request with a thread callback */
  my_aiocb.aio_sigevent.sigev_notify = SIGEV_THREAD;
  my_aiocb.aio_sigevent.notify_function = aio_completion_handler;
  my_aiocb.aio_sigevent.notify_attributes = NULL;
  my_aiocb.aio_sigevent.sigev_value.sival_ptr = &my_aiocb;

  ...

  ret = aio_read( &my_aiocb );

}


void aio_completion_handler( sigval_t sigval )
{
  struct aiocb *req;

  req = (struct aiocb *)sigval.sival_ptr;

  /* Did the request complete? */
  if (aio_error( req ) == 0) {

    /* Request completed successfully, get the return status */
    ret = aio_return( req );

  }

  return;
}

在清單 6 中,在建立本身的 aiocb 請求以後,咱們使用 SIGEV_THREAD 請求了一個線程回調函數來做爲通知方法。而後咱們將指定特定的通知處理程序,並將要傳輸的上下文加載處處理程序中(在這種狀況中,是個對 aiocb 請求本身的引用)。在這個處理程序中,咱們簡單地引用到達的 sigval 指針並使用 AIO 函數來驗證請求已經完成。


對 AIO 進行系統優化

proc 文件系統包含了兩個虛擬文件,它們能夠用來對異步 I/O 的性能進行優化:

  • /proc/sys/fs/aio-nr 文件提供了系統範圍異步 I/O 請求如今的數目。
  • /proc/sys/fs/aio-max-nr 文件是所容許的併發請求的最大個數。最大個數一般是 64KB,這對於大部分應用程序來講都已經足夠了。

結束語

使用異步 I/O 能夠幫助咱們構建 I/O 速度更快、效率更高的應用程序。若是咱們的應用程序能夠對處理和 I/O 操做重疊進行,那麼 AIO 就能夠幫助咱們構建能夠更高效地使用可用 CPU 資源的應用程序。儘管這種 I/O 模型與在大部分 Linux 應用程序中使用的傳統阻塞模式都不一樣,可是異步通知模型在概念上來講卻很是簡單,能夠簡化咱們的設計。

相關文章
相關標籤/搜索