1.功能描述:後端
語音合成:基於業界領先的深度神經網絡技術,提供高度擬人、流暢天然的語音合成服務,讓您的應用、設備開口說話,更具個性服務器
2.特點優點網絡
支持多語言多音色測試
支持中文、英文、中英文混讀合成,提供基礎音庫和精品音庫共9種發音人供您選擇,讓您的應用擁有個性化的聲音code
豐富的場景應用token
支持純在線、純離線、離在線融合三種應用方式,支持在有網、無網、弱網環境下的合成播報,知足不一樣的場景需求接口
方便快捷的集成方式ip
提供REST API接口,方即可發起網絡請求的設備進行合成;提供Android、iOS SDK,輕巧簡便,便於手機、智能硬件快速集成開發
3.調用攻略(Python3)及評測文檔
3.1API(Python)說明:
請嚴格按照文檔裏描述的參數進行開發。請注意如下幾個問題:
1.合成文本長度必須小於1024字節,若是本文長度較長,能夠採用屢次請求的方式。切忌文本長度超過限制。
2.新建立語音合成應用不限制每日調用量,但有QPS限額。詳細限額數據可在控制檯中查看。完成我的實名認證及企業認證可提升QPS限額。若需更大QPS可進一步商務合做諮詢。
3.必填字段中,嚴格按照文檔描述中內容填寫。
配置AipSpeech
若是用戶須要配置AipSpeech的網絡請求參數(通常不須要配置),能夠在構造AipSpeech以後調用接口設置參數,目前只支持如下參數:
接口 說明
setConnectionTimeoutInMillis 創建鏈接的超時時間(單位:毫秒
setSocketTimeoutInMillis 經過打開的鏈接傳輸數據的超時時間(單位:毫秒)
3.2 接口說明
語音合成接口描述
基於該接口,開發者能夠輕鬆的獲取語音合成能力
輸入參數:
返回樣例:
// 成功返回二進制文件流
// 失敗返回
{
"err_no":500,
"err_msg":"notsupport.",
"sn":"abcdefgh",
"idx":1
}
錯誤信息
若請求錯誤,服務器將返回的JSON文本包含如下參數:
error_code:錯誤碼。
error_msg:錯誤描述信息,幫助理解和解決發生的錯誤。
錯誤碼 含義
500 不支持的輸入
501 輸入參數不正確
502 token驗證失敗
503 合成後端錯誤
3.3 代碼實現
Python3調用代碼以下:
from aip import AipSpeech
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
def doc2speech(content,resultfile):
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis(content, 'zh', 1, {
'vol': 5,
})
# 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼
if not isinstance(result, dict):
with open(resultfile, 'wb') as f:
f.write(result)
doc2speech('測試百度語音功能','../voc/voc1.mp3')
4.功能評測
選用不一樣的數據對效果進行測試,發現生成速度很快,效果很好。能夠應用於:
泛閱讀:經過閱讀類APP閱讀小說或新聞時,使用語音合成技術爲用戶提供多種發音人的朗讀功能,釋放雙手和雙眼,得到更極致的閱讀體驗
訂單播報:可應用於打車軟件、餐飲叫號、排隊軟件等場景,經過語音合成進行訂單播報,讓您便捷得到通知信息
智能硬件:可集成到兒童故事機、智能機器人、平板設備等智能硬件設備,使用戶與設備的交互更天然、更親切
等場景。
5 應用案例
應用語音合成功能對我之前寫的人羣流量方案進行升級,原文章連接以下:
https://ai.baidu.com/forum/topic/show/953160
原方案在發現過於擁擠後生成警告信息發給工做人員,由工做人員來進行疏散,須要比較長的時間週期。升級後直接對於過於擁擠的時候,除了發佈警告信息給工做人員以外,還經過語音合成生成警告信息,經過園區的廣播,直接指導人們離開過於擁擠的地方,下降危險性。
修改後的方案如圖所示:
例如對於案例中,設置的是:區域1一我的也不該該有(由於禁止游泳),區域2報警閾值650,區域3報警閾值200.
need-to-insert-img
那麼在分析後就會觸發針對區域2的報警廣播,「附近人員過多,最大650人,現已733人,請啓動限流疏散措施」。