1、前序git
這裏瞭解一下各個參數的含義以及一些基本概念。程序員
聲音是連續模擬量,計算機將它離散化以後用數字表示,就有了如下幾個名詞術語。編程
樣本長度(sample):樣本是記錄音頻數據最基本的單位,計算機對每一個通道採樣量化時數字比特位數,常見的有8位和16位。緩存
通道數(channel):該參數爲1表示單聲道,2則是立體聲。網絡
幀(frame):幀記錄了一個聲音單元,其長度爲樣本長度與通道數的乘積,一段音頻數據就是由苦幹幀組成的。app
採樣率(rate):每秒鐘採樣次數,該次數是針對幀而言,經常使用的採樣率如8KHz的人聲, 44.1KHz的mp3音樂, 96Khz的藍光音頻。框架
週期(period):音頻設備一次處理所須要的楨數,對於音頻設備的數據訪問以及音頻數據的存儲,都是以此爲單位。dom
交錯模式(interleaved):是一種音頻數據的記錄方式異步
在交錯模式下,數據以連續楨的形式存放,即首先記錄完楨1的左聲道樣本和右聲道樣本(假設爲立體聲格式),再開始楨2的記錄。ide
而在非交錯模式下,首先記錄的是一個週期內全部楨的左聲道樣本,再記錄右聲道樣本,數據是以連續通道的方式存儲。
不過多數狀況下,咱們只須要使用交錯模式就能夠了。
period(週期): 硬件中中斷間的間隔時間。它表示輸入延時。
比特率(Bits Per Second):比特率表示每秒的比特數,比特率=採樣率×通道數×樣本長度
---------------------------------------------------------------------------------------------------------------------------------------------------------------
2、ALSA介紹
一、ALSA聲音編程介紹
ALSA表示高級Linux聲音體系結構(Advanced Linux Sound Architecture)。
它由一系列內核驅動,應用程序編譯接口(API)以及支持Linux下聲音的實用程序組成。
這篇文章裏,我將簡單介紹 ALSA項目的基本框架以及它的軟件組成。主要集中介紹PCM接口編程,包括您能夠自動實踐的程序示例。
您使用ALSA的緣由可能就是由於它很新,但它並非惟一可用的聲音API。若是您想完成低級的聲音操做,以便可以最大化地控制聲音並最大化地提升性能,或者若是您使用其它聲音API沒有的特性,那麼ALSA是很好的選擇。若是您已經寫了一個音頻程序,你可能想要爲ALSA聲卡驅動添加本地支持。若是您對音頻不感興趣,只是想播放音頻文件,那麼高級的API將是更好的選擇,好比SDL,OpenAL以及那些桌面環境提供的工具集。另外,您只能在有ALSA 支持的Linux環境中使用ALSA。
二、ALSA歷史
ALSA項目發起的原由是Linux下的聲卡驅動(OSS/Free drivers)沒有獲得積極的維護。而且落後於新的聲卡技術。Jaroslav Kysela早先寫了一個聲卡驅動,並由此開始了ALSA項目,隨便,更多的開發者加入到開發隊伍中,更多的聲卡獲得支持,API的結構也獲得了重組。
Linux內核2.5在開發過程當中,ALSA被合併到了官方的源碼樹中。在發佈內核2.6後,ALSA已經內建在穩定的內核版本中並將普遍地使用。
三、數字音頻基礎
聲音由變化的氣壓組成。它被麥克風這樣的轉換器轉換成電子形式。
模/數(ADC)轉換器將模擬電壓轉換成離散的樣本值。
聲音以固定的時間間隔被採樣,採樣的速率稱爲採樣率。把樣本輸出到數/模(DAC)轉換器,好比擴音器,最後轉換成原來的模擬信號。
樣本大小以位來表示。樣本大小是影響聲音被轉換成數字信號的精確程度的因素之一。
另外一個主要的因素是採樣率。奈奎斯特(Nyquist)理論中,只要離散系統的奈奎斯特頻率高於採樣信號的最高頻率或帶寬,就能夠避免混疊現象。
四、ALSA基礎
ALSA由許多聲卡的聲卡驅動程序組成,同時它也提供一個稱爲libasound的API庫。
應用程序開發者應該使用libasound而不是內核中的 ALSA接口。由於libasound提供最高級而且編程方便的編程接口。而且提供一個設備邏輯命名功能,這樣開發者甚至不須要知道相似設備文件這樣的低層接口。
相反,OSS/Free驅動是在內核系統調用級上編程,它要求開發者提供設備文件名而且利用ioctrl來實現相應的功能。
爲了向後兼容,ALSA提供內核模塊來模擬OSS,這樣以前的許多在OSS基礎上開發的應用程序不須要任何改動就能夠在ALSA上運行。另外,libaoss庫也能夠模擬OSS,而它不須要內核模塊。
ALSA包含插件功能,使用插件能夠擴展新的聲卡驅動,包括徹底用軟件實現的虛擬聲卡。ALSA提供一系列基於命令行的工具集,好比混音器(mixer),音頻文件播放器(aplay),以及控制特定聲卡特定屬性的工具。
五、ALSA體系結構
ALSA API能夠分解成如下幾個主要的接口:
1 控制接口:提供管理聲卡註冊和請求可用設備的通用功能
2 PCM接口:管理數字音頻回放(playback)和錄音(capture)的接口。本文後續總結重點放在這個接口上,由於它是開發數字音頻程序最經常使用到的接口。
3 Raw MIDI接口:支持MIDI(Musical Instrument Digital Interface),標準的電子樂器。這些API提供對聲卡上MIDI總線的訪問。這個原始接口基於MIDI事件工做,由程序員負責管理協議以及時間處理。
4 定時器(Timer)接口:爲同步音頻事件提供對聲卡上時間處理硬件的訪問。
5 時序器(Sequencer)接口
6 混音器(Mixer)接口
六、設備命名
API庫使用邏輯設備名而不是設備文件。設備名字能夠是真實的硬件名字也能夠是插件名字。硬件名字使用hw:i,j這樣的格式。其中i是卡號,j是這塊聲卡上的設備號。
第一個聲音設備是hw:0,0.這個別名默認引用第一塊聲音設備而且在本文示例中一真會被用到。
插件使用另外的惟一名字,好比 plughw:,表示一個插件,這個插件不提供對硬件設備的訪問,而是提供像採樣率轉換這樣的軟件特性,硬件自己並不支持這樣的特性。
七、聲音緩存和數據傳輸
每一個聲卡都有一個硬件緩存區來保存記錄下來的樣本。
當緩存區足夠滿時,聲卡將產生一個中斷。
內核聲卡驅動而後使用直接內存(DMA)訪問通道將樣本傳送到內存中的應用程序緩存區。相似地,對於回放,任何應用程序使用DMA將本身的緩存區數據傳送到聲卡的硬件緩存區中。
這樣硬件緩存區是環緩存。也就是說當數據到達緩存區末尾時將從新回到緩存區的起始位置。
ALSA維護一個指針來指向硬件緩存以及應用程序緩存區中數據操做的當前位置。
從內核外部看,咱們只對應用程序的緩存區感興趣,因此本文只討論應用程序緩存區。
應用程序緩存區的大小能夠經過ALSA庫函數調用來控制。
緩存區能夠很大,一次傳輸操做可能會致使不可接受的延遲,咱們把它稱爲延時(latency)。
爲了解決這個問題,ALSA將緩存區拆分紅一系列週期(period)(OSS/Free中叫片段fragments).ALSA以period爲單元來傳送數據。
一個週期(period)存儲一些幀(frames)。每一幀包含時間上一個點所抓取的樣本。對於立體聲設備,一個幀會包含兩個信道上的樣本。
分解過程:一個緩存區分解成周期,而後是幀,而後是樣本。
左右信道信息被交替地存儲在一個幀內。這稱爲交錯 (interleaved)模式。
在非交錯模式中,一個信道的全部樣本數據存儲在另一個信道的數據以後。
八、Over and Under Run
當一個聲卡活動時,數據老是連續地在硬件緩存區和應用程序緩存區間傳輸。
可是也有例外。
在錄音例子中,若是應用程序讀取數據不夠快,循環緩存區將會被新的數據覆蓋。這種數據的丟失被稱爲"over run".
在回放例子中,若是應用程序寫入數據到緩存區中的速度不夠快,緩存區將會"餓死"。這樣的錯誤被稱爲"under run"。
在ALSA文檔中,有時將這兩種情形統稱爲"XRUN"。適當地設計應用程序能夠最小化XRUN而且能夠從中恢復過來。
XRUN狀態又分有兩種,在播放時,用戶空間沒及時寫數據致使緩衝區空了,硬件沒有 可用數據播放致使"under run"; 錄製時,用戶空間沒有及時讀取數據致使緩衝區滿後溢出, 硬件錄製的數據沒有空閒緩衝可寫致使"over run".
當用戶空間因爲系統繁忙等緣由,致使hw_ptr>appl_ptr時,緩衝區已空,內核這裏有兩種方案:
中止DMA傳輸,進入XRUN狀態。這是內核默認的處理方法。 繼續播放緩衝區的重複的音頻數據或靜音數據。
用戶空間配置stop_threshold可選擇方案1或方案2,配置silence_threshold選擇繼 續播放的原有的音頻數據仍是靜意數據了。我的經驗,偶爾的系統繁忙致使的這種狀態, 重複播放原有的音頻數據會顯得更平滑,效果更好。
九、音頻參數(ALSA 用戶空間之 TinyAlsa)
TinyAlsa是 Android 默認的 alsalib, 封裝了內核 ALSA 的接口,用於簡化用戶空 間的 ALSA 編程。
合理的pcm_config能夠作到更好的低時延和功耗,移動設備的開發優爲敏感。
struct pcm_config { unsigned int channels; unsigned int rate; unsigned int period_size; unsigned int period_count; enum pcm_format format; unsigned int start_threshold; unsigned int stop_threshold; unsigned int silence_threshold; int avail_min; };
解釋一下結構中的各個參數,每一個參數的單位都是frame(1幀 = 通道*採樣位深):
period_size. 每次傳輸的數據長度。值越小,時延越小,cpu佔用就越高。
period_count. 緩之衝區period的個數。緩衝區越大,發生XRUN的機會就越少。
format. 定義數據格式,如採樣位深,大小端。
start_threshold. 緩衝區的數據超過該值時,硬件開始啓動數據傳輸。若是太大, 從開始播放到聲音出來時延太長,甚至可致使過短促的聲音根本播不出來;若是過小, 又可能容易致使XRUN.
stop_threshold. 緩衝區空閒區大於該值時,硬件中止傳輸。默認狀況下,這個數 爲整個緩衝區的大小,即整個緩衝區空了,就中止傳輸。但偶爾的緣由致使緩衝區空, 如CPU忙,增大該值,繼續播放緩衝區的歷史數據,而不關閉再啓動硬件傳輸(通常此 時有明顯的聲音卡頓),能夠達到更好的體驗。
silence_threshold. 這個值原本是配合stop_threshold使用,往緩衝區填充靜音 數據,這樣就不會重播歷史數據了。但若是沒有設定silence_size,這個值會生效嗎? 求解??
avail_min. 緩衝區空閒區大於該值時,pcm_mmap_write()才往緩衝寫數據。這個 值越大,往緩衝區寫入數據的次數就越少,面臨XRUN的機會就越大。Android samsung tuna 設備在screen_off時增大該值以減少功耗,在screen_on時減少該 值以減少XRUN的機會。
在不一樣的場景下,合理的參數就是在性能、時延、功耗等之間達到較好的平衡。
有朋友問爲何在pcm_write()/pcm_mmap_write(),而不在pcm_open()調用pcm_start()? 這是由於音頻流與其它的數據不一樣,實時性要求很高。做爲 TinyAlsa的實現者,不能假定在調用者open以後及時的write數據,因此只能在有 數據寫入的時候start設備了。
Mixer的實現很明瞭,經過ioctl()調用訪問kcontrols.
十、一個典型的聲音程序
1 使用PCM的程序一般相似下面的僞代碼:
2 打開回放或錄音接口
3 設置硬件參數(訪問模式,數據格式,信道數,採樣率,等等)
4 while 有數據要被處理:
5 讀PCM數據(錄音) 或 寫PCM數據(回放)
6 關閉接口
------------------------------------------------------------------------------------------------------------------------------------------------------------------
3、實例
一、顯示了一些ALSA使用的PCM數據類型和參數。
#include <alsa/asoundlib.h> int main() { int val; printf("ALSA library version: %s\n", SND_LIB_VERSION_STR); printf("\nPCM stream types:\n"); for (val = 0; val <= SND_PCM_STREAM_LAST; val++) printf(" %s\n", snd_pcm_stream_name((snd_pcm_stream_t)val)); printf("\nPCM access types:\n"); for (val = 0; val <= SND_PCM_ACCESS_LAST; val++) { printf(" %s\n", snd_pcm_access_name((snd_pcm_access_t)val)); } printf("\nPCM formats:\n"); for (val = 0; val <= SND_PCM_FORMAT_LAST; val++) { if (snd_pcm_format_name((snd_pcm_format_t)val)!= NULL) { printf(" %s (%s)\n", snd_pcm_format_name((snd_pcm_format_t)val), snd_pcm_format_description( (snd_pcm_format_t)val)); } }
printf("\nPCM subformats:\n"); for (val = 0; val <= SND_PCM_SUBFORMAT_LAST;val++) { printf(" %s (%s)\n", snd_pcm_subformat_name(( snd_pcm_subformat_t)val), snd_pcm_subformat_description(( snd_pcm_subformat_t)val)); }
printf("\nPCM states:\n"); for (val = 0; val <= SND_PCM_STATE_LAST; val++) printf(" %s\n", snd_pcm_state_name((snd_pcm_state_t)val)); return 0; }
首先須要作的是包括頭文件。這些頭文件包含了全部庫函數的聲明。其中之一就是顯示ALSA庫的版本。
這個程序剩下的部分的迭代一些PCM數據類型,以流類型開始。ALSA爲每次迭代的最後值提供符號常量名,而且提供功能函數以顯示某個特定值的描述字符串。你將會看到,ALSA支持許多格式,在個人1.0.15版本里,支持多達36種格式。
這個程序必須連接到alsalib庫,經過在編譯時須要加上-lasound選項。有些alsa庫函數使用dlopen函數以及浮點操做,因此您可能還須要加上-ldl,-lm選項。
編譯:gcc -o main test.c -lasound
二、打開默認的PCM設備,設置一些硬件參數而且打印出最經常使用的硬件參數值
Int32 Audio_alsaSetparams(Alsa_Env *pEnv, int verbose) { Int32 err = 0; Uint32 rate, n; snd_pcm_t *handle; snd_output_t *log; snd_pcm_hw_params_t *params; snd_pcm_sw_params_t *swparams; snd_pcm_uframes_t buffer_size; snd_pcm_uframes_t start_threshold, stop_threshold; unsigned int buffer_time, period_time; handle = pEnv->handle; err = snd_output_stdio_attach(&log, stderr, 0); OSA_assert(err >= 0); snd_pcm_hw_params_alloca(¶ms); snd_pcm_sw_params_alloca(&swparams); err = snd_pcm_hw_params_any(handle, params); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("Broken configuration for this PCM:" "no configurations available(%s)\n", err, handle); } err = snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set access type (%s)\n", err, handle); } err = snd_pcm_hw_params_set_format(handle, params, pEnv->format); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set sample format (%s)\n", err, handle); } err = snd_pcm_hw_params_set_channels(handle, params, pEnv->channels); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set channel count (%s)\n", err, handle); } rate = pEnv->rate; err = snd_pcm_hw_params_set_rate_near(handle, params, &pEnv->rate, 0); OSA_assert(err >= 0); if ((float)rate * 1.05 < pEnv->rate || (float)rate * 0.95 > pEnv->rate) { fprintf(stderr, "Warning: rate is not accurate" "(requested = %iHz, got = %iHz)\n", rate, pEnv->rate); } rate = pEnv->rate; /* following setting of period size is done only for AIC3X. Leaving default for HDMI */ if (pEnv->resample) { /* Restrict a configuration space to contain only real hardware rates. */ snd_pcm_hw_params_set_rate_resample(handle, params, 1); } buffer_time = 0; period_time = 0; if (pEnv->periods == 0) { err = snd_pcm_hw_params_get_buffer_time_max(params, &buffer_time, 0); OSA_assert(err >= 0); /* in microsecond */ if (buffer_time > 500000) buffer_time = 500000; /* 500ms */ } if (buffer_time > 0) period_time = buffer_time / 4; if (period_time > 0) err = snd_pcm_hw_params_set_period_time_near(handle, params, &period_time, 0); else err = snd_pcm_hw_params_set_period_size_near(handle, params, &pEnv->periods, 0); OSA_assert(err >= 0); if (period_time > 0) { err = snd_pcm_hw_params_set_buffer_time_near(handle, params, &buffer_time, 0); } else { buffer_size = pEnv->periods * 4; err = snd_pcm_hw_params_set_buffer_size_near(handle, params, &buffer_size); } OSA_assert(err >= 0); err = snd_pcm_hw_params(handle, params); if (err < 0) { fprintf(stderr, "cannot set alsa hw parameters %d\n", err); return err; } /* Get alsa interrupt duration */ snd_pcm_hw_params_get_period_size(params, &pEnv->periods, 0); snd_pcm_hw_params_get_buffer_size(params, &buffer_size); if (pEnv->periods == buffer_size) { fprintf(stderr, "Can't use period equal to buffer size (%lu == %lu)\n", pEnv->periods, buffer_size); return -1; } /* set software params */ snd_pcm_sw_params_current(handle, swparams); n = pEnv->periods; /* set minimum avil size -> 1 period size */ err = snd_pcm_sw_params_set_avail_min(handle, swparams, n); OSA_assert(err >= 0); n = buffer_size; /* in microsecond -> divide 1000000 */ if (pEnv->start_delay <= 0) start_threshold = n + (double)rate * pEnv->start_delay / 1000000; else start_threshold = (double)rate * pEnv->start_delay / 1000000; if (start_threshold < 1) start_threshold = 1; if (start_threshold > n) start_threshold = n; /* set pcm auto start condition */ err = snd_pcm_sw_params_set_start_threshold(handle, swparams, start_threshold); OSA_assert(err >= 0); /* in microsecond -> divide 1000000 */ if (pEnv->stop_delay <= 0) stop_threshold = buffer_size + (double)rate * pEnv->stop_delay / 1000000; else stop_threshold = (double)rate * pEnv->stop_delay / 1000000; err = snd_pcm_sw_params_set_stop_threshold(handle, swparams, stop_threshold); OSA_assert(err >= 0); err = snd_pcm_sw_params(handle, swparams); if (err < 0) { fprintf(stderr, "unable to install sw params\n"); return err; } if (verbose) snd_pcm_dump(handle, log); snd_output_close(log); return err; }
1)snd_pcm_open打開默認的PCM 設備並設置訪問模式爲PLAYBACK。這個函數返回一個句柄,這個句柄保存在第一個函數參數中。該句柄會在隨後的函數中用到。像其它函數同樣,這個函數返回一個整數。
2)若是返回值小於0,則代碼函數調用出錯。若是出錯,咱們用snd_errstr打開錯誤信息並退出。
3)爲了設置音頻流的硬件參數,咱們須要分配一個類型爲snd_pcm_hw_param的變量。分配用到函數宏 snd_pcm_hw_params_alloca。
4)下一步,咱們使用函數snd_pcm_hw_params_any來初始化這個變量,傳遞先前打開的 PCM流句柄。
5)接下來,咱們調用API來設置咱們所需的硬件參數。
這些函數須要三個參數:PCM流句柄,參數類型,參數值。
咱們設置流爲交錯模式,16位的樣本大小,2 個信道,44100bps的採樣率。
對於採樣率而言,聲音硬件並不必定就精確地支持咱們所定的採樣率,可是咱們可使用函數 snd_pcm_hw_params_set_rate_near來設置最接近咱們指定的採樣率的採樣率。
其實只有當咱們調用函數 snd_pcm_hw_params後,硬件參數纔會起做用。
6)程序的剩餘部分得到並打印一些PCM流參數,包括週期和緩衝區大小。結果可能會由於聲音硬件的不一樣而不一樣。
運行該程序後,作實驗,改動一些代碼。把設備名字改爲hw:0,0,而後看結果是否會有變化。設置不一樣的硬件參數而後觀察結果的變化。
三、添加聲音回放
/* This example reads standard from input and writes to the default PCM device for 5 seconds of data. */ /* Use the newer ALSA API */ #define ALSA_PCM_NEW_HW_PARAMS_API #include <alsa/asoundlib.h> int main() { long loops; int rc; int size; snd_pcm_t *handle; snd_pcm_hw_params_t *params; unsigned int val; int dir; snd_pcm_uframes_t frames; char *buffer; /* Open PCM device for playback. */ rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_PLAYBACK, 0); if (rc < 0) { fprintf(stderr,"unable to open pcm device: %s\n",snd_strerror(rc)); exit(1); } /* Allocate a hardware parameters object. */ snd_pcm_hw_params_alloca(?ms); /* Fill it in with default values. */ snd_pcm_hw_params_any(handle, params); /* Set the desired hardware parameters. */ /* Interleaved mode */ snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); /* Signed 16-bit little-endian format */ snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE); /* Two channels (stereo) */ snd_pcm_hw_params_set_channels(handle, params, 2); /* 44100 bits/second sampling rate (CD quality) */ val = 44100; snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir); /* Set period size to 32 frames. */ frames = 32; snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir); /* Write the parameters to the driver */ rc = snd_pcm_hw_params(handle, params); if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1); } /* Use a buffer large enough to hold one period */ snd_pcm_hw_params_get_period_size(params, &frames, &dir); size = frames * 4; /* 2 bytes/sample, 2 channels */ buffer = (char *) malloc(size); /* We want to loop for 5 seconds */ snd_pcm_hw_params_get_period_time(params,&val, &dir); /* 5 seconds in microseconds divided by * period time */ loops = 5000000 / val; while (loops > 0) //循環錄音 5 s { loops--; rc = read(0, buffer, size); if (rc == 0) //沒有讀取到數據 { fprintf(stderr, "end of file on input\n"); break; } else if (rc != size)//實際讀取 的數據 小於 要讀取的數據 { fprintf(stderr,"short read: read %d bytes\n", rc); } rc = snd_pcm_writei(handle, buffer, frames);//寫入聲卡 (放音) if (rc == -EPIPE) { /* EPIPE means underrun */ fprintf(stderr, "underrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr,"error from writei: %s\n",snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr,"short write, write %d frames\n", rc); } } snd_pcm_drain(handle); snd_pcm_close(handle); free(buffer); return 0; }
在這個例子中,咱們從標準輸入中讀取數據,每一個週期讀取足夠多的數據,而後將它們寫入到聲卡中,直到5秒鐘的數據所有傳輸完畢。
這個程序的開始處和以前的版本同樣---打開PCM設備、設置硬件參數。咱們使用由ALSA本身選擇的週期大小,申請該大小的緩衝區來存儲樣本。而後咱們找出週期時間,這樣咱們就能計算出本程序爲了可以播放5秒鐘,須要多少個週期。
在處理數據的循環中,咱們從標準輸入中讀入數據,並往緩衝區中填充一個週期的樣本。而後檢查並處理錯誤,這些錯誤多是由到達文件結尾,或讀取的數據長度與我指望的數據長度不一致致使的。
咱們調用snd_pcm_writei來發送數據。它操做起來很像內核的寫系統調用,只是這裏的大小參數是以幀來計算的。咱們檢查其返回代碼值。返回值爲EPIPE代表發生了underrun,使得PCM音頻流進入到XRUN狀態並中止處理數據。從該狀態中恢復過來的標準方法是調用snd_pcm_prepare()函數,把PCM流置於PREPARED狀態,這樣下次咱們向該PCM流中數據時,它就能從新開始處理數據。若是咱們獲得的錯誤碼不是EPIPE,咱們把錯誤碼打印出來,而後繼續。最後,若是寫入的幀數不是咱們指望的,則打印出錯誤消息。
這個程序一直循環,直到5秒鐘的幀所有傳輸完,或者輸入流讀到文件結尾。而後咱們調用snd_pcm_drain把全部掛起沒有傳輸完的聲音樣本傳輸徹底,最後關閉該音頻流,釋放以前動態分配的緩衝區,退出。
咱們能夠看到這個程序沒有什麼用,除非標準輸入被重定向到了其它其它的文件。
嘗試用設備/dev/urandom來運行這個程序,該設備產生隨機數據:
./example3 </dev/urandom
隨機數據會產生5秒鐘的白色噪聲。
而後,嘗試把標準輸入重定向到設備/dev/null和/dev/zero上,並比較結果。改變一些參數,例如採樣率和數據格式,而後查看結果的變化。
四、添加錄音
/* This example reads from the default PCM device and writes to standard output for 5 seconds of data. */ /* Use the newer ALSA API */ #define ALSA_PCM_NEW_HW_PARAMS_API #include <alsa/asoundlib.h> int main() { long loops; int rc; int size; snd_pcm_t *handle; snd_pcm_hw_params_t *params; unsigned int val; int dir; snd_pcm_uframes_t frames; char *buffer; /* Open PCM device for recording (capture). */ rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_CAPTURE, 0); if (rc < 0) { fprintf(stderr, "unable to open pcm device: %s\n", snd_strerror(rc)); exit(1); } /* Allocate a hardware parameters object. */ snd_pcm_hw_params_alloca(?ms); /* Fill it in with default values. */ snd_pcm_hw_params_any(handle, params); /* Set the desired hardware parameters. */ /* Interleaved mode */ snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); /* Signed 16-bit little-endian format */ snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE); /* Two channels (stereo) */ snd_pcm_hw_params_set_channels(handle, params, 2); /* 44100 bits/second sampling rate (CD quality) */ val = 44100; snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir); /* Set period size to 32 frames. */ frames = 32; snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir); /* Write the parameters to the driver */ rc = snd_pcm_hw_params(handle, params); if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1); } /* Use a buffer large enough to hold one period */ snd_pcm_hw_params_get_period_size(params, &frames, &dir); size = frames * 4; /* 2 bytes/sample, 2 channels */ buffer = (char *) malloc(size); /* We want to loop for 5 seconds */ snd_pcm_hw_params_get_period_time(params, &val, &dir); loops = 5000000 / val; while (loops > 0) { loops--; rc = snd_pcm_readi(handle, buffer, frames); if (rc == -EPIPE) { /* EPIPE means overrun */ fprintf(stderr, "overrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr, "error from read: %s\n", snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr, "short read, read %d frames\n", rc); } rc = write(1, buffer, size); if (rc != size) fprintf(stderr, "short write: wrote %d bytes\n", rc); } snd_pcm_drain(handle); snd_pcm_close(handle); free(buffer); return 0; }
當打開PCM設備時咱們指定打開模式爲SND_PCM_STREAM_CPATURE。在主循環中,咱們調用snd_pcm_readi()從聲卡中讀取數據,並把它們寫入到標準輸出。一樣地,咱們檢查是否有overrun,若是存在,用與前例中相同的方式處理。
運行清單4的程序將錄製將近5秒鐘的聲音數據,並把它們發送到標準輸出。你也能夠重定向到某個文件。若是你有一個麥克風鏈接到你的聲卡,可使用某個混音程序(mixer)設置錄音源和級別。一樣地,你也能夠運行一個CD播放器程序並把錄音源設成CD。
運行程序4並把輸出定向到某個文件,而後運行程序 3播放該文件裏的聲音數據:
./listing4 > sound.raw
./listing3 < sound.raw
若是你的聲卡支持全雙工,你能夠經過管道把兩個程序鏈接起來,這樣就能夠從聲卡中聽到錄製的聲音:
./listing4 | ./listing3
一樣地,您能夠作實驗,看看採樣率和樣本格式的變化會產生什麼影響。
------------------------------------------------------------------------------------------------------------------------------------------------------------------
4、高級特性
在前面的例子中,PCM流是以阻塞模式操做的,也就是說,直到數據已經傳送完,PCM接口調用纔會返回。在事件驅動的交互式程序中,這樣會長時間阻塞應用程序,一般是不能接受的。
ALSA支持以非阻塞模式打開音頻流,這樣讀寫函數調用後當即返回。若是數據傳輸被掛起,調用不能被處理,ALSA就是返回一個 EBUSY的錯誤碼。
許多圖形應用程序使用回調來處理事件。ALSA支持以異步的方式打開一個PCM音頻流。這使得當某個週期的樣本數據被傳輸完後,某個已註冊的回調函數將會調用。
這裏用到的snd_pcm_readi()和snd_pcm_writei()調用和Linux下的讀寫系統調用相似。
字母i表示處理的幀是交錯式 (interleaved)的。ALSA中存在非交互模式的對應的函數。
Linux下的許多設備也支持mmap系統調用,這個調用將設備內存映射到主內存,這樣數據就能夠用指針來維護。
ALSA也運行以mmap模式打開一個PCM信道,這容許有效的零拷貝(zero copy)方式訪問聲音數據。
最後,我但願這篇文章可以激勵你嘗試編寫某些ALSA程序。伴隨着2.6內核在Linux發佈版本(distributions)中被普遍地使用,ALSA也將被普遍地採用。它的高級特徵將幫助Linux音頻程序更好地向前發展。
本文轉載自網絡,僅供學習交流