2012.11.7

這幾天一直在作在線的語音識別Demo,核心的識別器是基於Google的的開放接口,使用十分方便,輸入爲flac格式的文件,輸出了JSON格式的結果。但外圍框架十分繁瑣,大部分在於使用了MIT的Wami網頁錄音接口。整個的框架涉及的模塊較多,有首先是HTML調用了PHP寫的錄音程序,生成Wav文件,由外圍工具flac將其轉換爲flac格式的文件,再由Python寫的識別程序進行識別,並最終將結果返回
相關文章
相關標籤/搜索