AUDIO latency

音頻延遲時間

視頻

音頻延遲時間:緩衝區大小html

視頻

在 Android 上打造出色的多媒體體驗java

延遲時間是指信號在系統中傳輸所需的時間。下面是與音頻應用相關的常見類型的延遲時間:android

  • 音頻輸出時間延遲是指音頻樣本由應用生成到經過耳機插孔或內置揚聲器播放之間的時間。
  • 音頻輸入延遲時間是指音頻信號由設備音頻輸入(如麥克風)接收到相同音頻數據可被應用使用的時間。
  • 往返延遲時間是指輸入延遲時間、應用處理時間和輸出延遲時間的總和。git

  • 觸摸延遲時間是指用戶觸摸屏幕與觸摸事件被應用接收之間的時間。
  • 預熱延遲時間是指啓動音頻管道、數據第一次在緩衝區加入隊列所需的時間。

本頁面將介紹如何在開發您的音頻應用時保證低輸入和輸出延遲時間以及如何避免出現預熱延遲時間。github

先決條件


僅在使用 OpenSL ES™ API 的 Android 實現和 Android NDK 時,才支持低延遲時間音頻。shell

測量延遲時間


很難單獨測量音頻輸入和輸出延遲時間,由於須要準確地瞭解第一個樣本什麼時候傳送入音頻路徑(儘管可使用光檢測電路和示波器完成)。 若是您瞭解往返音頻延遲時間,則可使用通常經驗法則:音頻輸入(和輸出)延遲時間是通過無信號處理路徑的往返音頻延遲時間的一半app

往返音頻延遲時間根據設備型號和 Android 版本號的不一樣而大不相同。 您能夠經過閱讀已發佈的測量值大略瞭解 Nexus 設備的往返延遲時間。異步

您能夠經過建立應用測量往返音頻延遲時間,該應用可以生成音頻信號、偵聽此音頻信號和測量發送與接收信號之間的時間。或者,您也能夠安裝此延遲時間測試應用。 此應用使用拉森測試執行往返延遲時間測試。 您也能夠查看延遲時間測試應用的源代碼ide

因爲最低延遲時間是在信號處理最少的音頻路徑上得到的,您可能還想使用迴環音頻適配器,它讓測試可以經過耳麥鏈接器運行。oop

最大程度減小延遲時間的最佳作法


驗證音頻性能

Android 兼容性定義文檔 (CDD) 枚舉了兼容 Android 設備的硬件和軟件要求。請參閱 Android 兼容性瞭解與總體兼容性計劃有關的詳細信息,參閱 CDD 瞭解實際的 CDD 文檔。

在 CDD 中,往返延遲時間被指定爲 20 毫秒或更低(而樂師一般須要 10 毫秒)。 這是由於 20 毫秒能夠實現一些重要的用例。

當前沒有 API 能夠在運行時肯定 Android 設備上經過任何路徑的音頻延遲時間。 不過,您可使用下列硬件功能標記了解設備是否能爲延遲時間提供任何保證:

報告這些標記的標準在 CDD 的 5.6 音頻延遲時間和 5.10 專業音頻部分中定義。

如下是如何在 Java 中檢查這些功能:

boolean hasLowLatencyFeature =
    getPackageManager().hasSystemFeature(PackageManager.FEATURE_AUDIO_LOW_LATENCY);

boolean hasProFeature =
    getPackageManager().hasSystemFeature(PackageManager.FEATURE_AUDIO_PRO);

對於各音頻功能的關係,android.hardware.audio.low_latency 功能是 android.hardware.audio.pro 的先決條件。 設備能夠實現 android.hardware.audio.low_latency 而不能實現 android.hardware.audio.pro,但反之則否則。

不做有關音頻性能的假設

請注意有助於避免延遲時間問題的下列假設:

  • 不要假設移動設備中使用的揚聲器和麥克風一般擁有良好的音效。 它們的體積較小,一般音效較差,因此增長信號處理來提升音質。 此信號處理會引發延遲。
  • 不要假設您的輸入和輸出回調是同步的。對於同步輸入和輸出,將爲每一側使用單獨的緩衝區隊列完成處理程序。 即便兩側均採用相同的採樣率,也沒法保證這些回調的相對順序或音頻時鐘的同步。 您的應用應當在適當同步緩衝區的狀況下緩衝數據。
  • 不要假設實際採樣率與名義採樣率徹底一致。例如,若是名義採樣率是 48,000 Hz,則正常狀況下,音頻時鐘會使用與操做系統 CLOCK_MONOTONIC 稍微不一樣的採樣率計時。 這是由於音頻和系統時鐘由不一樣的晶體制成。
  • 不要假設實際回放樣本率與實際捕獲採樣率徹底一致,特別是端點在單獨的路徑上時。 例如,若是您正以 48,000 Hz 的名義採樣率從設備上的麥克風捕獲數據,並以 48,000 Hz 的名義採樣率在 USB 上播放音頻,實際採樣率極可能會彼此稍有不一樣。

潛在獨立的音頻時鐘的一個結果是須要異步採樣率轉換。 異步採樣率轉換的簡單(儘管音頻質量不理想)方法是根據須要在接近過零點的位置重複或減小樣本。 也能夠進行更復雜的轉換。

最大程度減小輸入延遲時間


此部分會提供建議,幫助您在使用內置麥克風或外部耳麥麥克風錄音時減小音頻輸入延遲時間。

  • 若是您的應用要監控輸入,建議您的用戶使用耳麥(例如,經過在第一次運行時顯示最好使用耳機屏幕)。 請注意,僅使用耳麥沒法保證儘量最低的延遲時間。 您可能須要執行其餘步驟從音頻路徑中移除任何不須要的信號處理(例如,在錄音時經過使用 VOICE_RECOGNITION 預設值)。
  • 準備好處理由 PROPERTY_OUTPUT_SAMPLE_RATE 的 getProperty(String) 報告的名義採樣率 44,100 和 48,000 Hz。 也有其餘採樣率,但不多見。
  • 準備好處理由 PROPERTY_OUTPUT_FRAMES_PER_BUFFER 的 getProperty(String) 報告的緩衝區大小。 典型的緩衝區大小包括 9六、12八、160、19二、240、256 或 512 幀,但也有其餘值。

最大程度減小輸出延遲時間


建立您的音頻播放器時使用最佳採樣率

要得到最低延遲時間,您必須提供與設備的最佳採樣率和緩衝區大小匹配的音頻數據。 如需瞭解詳細信息,請參閱面向更低的延遲時間設計

以下列代碼示例中所示,在 Java 中,您能夠從 AudioManager 得到最佳採樣率:

AudioManager am = (AudioManager) getSystemService(Context.AUDIO_SERVICE);
String sampleRateStr = am.getProperty(AudioManager.PROPERTY_OUTPUT_SAMPLE_RATE);
int sampleRate = Integer.parseInt(sampleRateStr);
if (sampleRate == 0) sampleRate = 44100; // Use a default value if property not found

知道最佳採樣率後,您能夠在使用 OpenSL ES 建立您的播放器時提供具體數值:

// create buffer queue audio player
void Java_com_example_audio_generatetone_MainActivity_createBufferQueueAudioPlayer
        (JNIEnv* env, jclass clazz, jint sampleRate, jint framesPerBuffer)
{
   ...
   // specify the audio source format
   SLDataFormat_PCM format_pcm;
   format_pcm.numChannels = 2;
   format_pcm.samplesPerSec = (SLuint32) sampleRate * 1000;
   ...
}

samplesPerSec 指的是每一個通道的採樣率,單位爲毫赫(1 Hz = 1000 mHz)。

將音頻數據加入隊列時使用最佳緩衝區大小

您能夠經過 AudioManager API 採用與得到最佳採樣率類似的方式得到最佳緩衝區大小:

AudioManager am = (AudioManager) getSystemService(Context.AUDIO_SERVICE);
String framesPerBuffer = am.getProperty(AudioManager.PROPERTY_OUTPUT_FRAMES_PER_BUFFER);
int framesPerBufferInt = Integer.parseInt(framesPerBuffer);
if (framesPerBufferInt == 0) framesPerBufferInt = 256; // Use default

PROPERTY_OUTPUT_FRAMES_PER_BUFFER 屬性表示 HAL(硬件抽象層)緩衝區能夠容納的音頻幀數量。 您應構建音頻緩衝區,使其能夠容納這個數量的確切倍數。 若是使用準確數量的音頻幀,會按期出現回調,這將減小抖動。

使用 API 而不是硬編碼值來肯定緩衝區大小相當重要,由於在不一樣的設備和 Android 版本號中,HAL 緩衝區大小會有所不一樣。

避免添加涉及信號處理的輸出接口

快速混合器僅支持下列這些接口:

  • SL_IID_ANDROIDSIMPLEBUFFERQUEUE
  • SL_IID_VOLUME
  • SL_IID_MUTESOLO

不支持如下這些接口,由於它們涉及信號處理,且會致使快速音軌的請求被拒絕:

  • SL_IID_BASSBOOST
  • SL_IID_EFFECTSEND
  • SL_IID_ENVIRONMENTALREVERB
  • SL_IID_EQUALIZER
  • SL_IID_PLAYBACKRATE
  • SL_IID_PRESETREVERB
  • SL_IID_VIRTUALIZER
  • SL_IID_ANDROIDEFFECT
  • SL_IID_ANDROIDEFFECTSEND

建立播放器時,請確保僅添加快速接口,如如下示例所示:

const SLInterfaceID interface_ids[2] = { SL_IID_ANDROIDSIMPLEBUFFERQUEUE, SL_IID_VOLUME };

驗證您正在使用低延遲時間音軌

完成下列這些步驟以驗證您是否已成功得到低延遲時間音軌:

    1. 啓動您的應用,而後運行下列命令:
adb shell ps | grep your_app_name
    1. 記下您應用的進程 ID。
    2. 如今,從您的應用播放一些音頻。您大約有三秒鐘的時間能夠從終端運行下列命令:
adb shell dumpsys media.audio_flinger
  1. 掃描您的進程 ID。若是您在 Name 列看到 F,表示它在低延遲時間音軌上(F 表明快速音軌)。

最大程度減小預熱延遲時間


第一次將音頻數據加入隊列時,設備音頻電路須要較短、但仍十分重要的一段時間來預熱。 要避免這種預熱延遲時間,您能夠將包含無聲的音頻數據緩衝區加入隊列,如如下代碼示例所示:

#define CHANNELS 1
static short* silenceBuffer;
int numSamples = frames * CHANNELS;
silenceBuffer = malloc(sizeof(*silenceBuffer) * numSamples);
    for (i = 0; i < numSamples; i++) {
        silenceBuffer[i] = 0;
    }

須要生成音頻時,您能夠將包含真實音頻數據的緩衝區加入隊列。

:持續輸出音頻將消耗大量的電量。請確保您在 onPause() 方法中中止輸出。另外,請考慮在用戶無活動的一段時間後暫停無聲輸出。

更多信息


  1. 適合應用開發者的音頻延遲時間
  2. 影響音頻延遲時間的因素
  3. 測量音頻延遲時間
  4. 音頻預熱
  5. 延遲時間(音頻)
  6. 往返延遲時間
相關文章
相關標籤/搜索