使用百度語音識別(linux c++ SDK)的踩坑

最近一個項目須要用到語音識別,將長語音轉換成文字,因爲騰訊,阿里,訊飛的長語音識別都收費,所以選擇了百度。linux

因爲不知道是本身太渣仍是百度的文檔寫的太奇怪,一開始看到這東西的時候弄得我焦頭爛額,在網上找人家踩過的坑,竟然一個也沒找到,是沒人用麼= =c++

[百度linux c++ sdk 文檔](http://ai.baidu.com/docs/#/ASR-Linux-SDK/top)git

[百度linux c++ sdk 下載](http://ai.baidu.com/sdk#asr)github

[個人修改過的github地址](https://github.com/formattor/asr-linux-cpp-change)算法

官方文檔的目錄結構是這樣的

BDSpeechSDK中包含extern, include, lib, sample, resources五個目錄。 若是您須要測試SDK,請至sample目錄。測試

  • extern包含須要的第三方庫和頭文件orm

  • include包含須要引入的頭文件接口

    • BDSpeechSDK.hpp包含sdk可用接口
    • BDSSDKMessage.hpp 包含給sdk發送的消息的結構定義
    • ASR/bds_ASRDefines.hpp 包含sdk相關參數取值的定義,錯誤分類,對應錯誤碼
    • ASR/bds_asr_key_definitions.hpp 包含sdk相關參數的定義
  • lib 包含須要引入的SDK庫文件文檔

  • resources 包含sdk VAD 算法須要的模型文件get

  • sample 目錄下有3個示例

本人修該的僅僅是sample/asrDemo2

(未完待續。。。)

相關文章
相關標籤/搜索