百度大腦UNIT3.0詳解之語音語義一體化方案

在電話客服場景裏,用戶和機器人交流的過程當中,常常會出現沉默、打斷機器人、噪聲等狀況,機器人在應對這些異常狀況的時候,須要語音和語義理解技術進行處理,才能實現用戶和機器人的流暢交談。而這些能力的獲取與應用,也是企業智能對話項目落地過程當中須要解決的難題之一。html

爲此,UNIT帶來了全新的語音語義一體化解決方案,幫助企業解決語音交互過程當中的難題。編程

【電話客服場景下語音語義一體化解決方案】網絡

image.png

語音語義一體化是針對電話客服對話場景的技術方案,可用於呼叫中心智能客服等業務。整個方案包含如下內容:框架

(1)下降集成開發成本學習

提供語音識別、語義理解、對話流程控制、知識庫、語音合成的打通方案,全雙工對話能力,一體化的部署方案,省去開發者對各環節自行調用、拼裝的學習成本以及二次開發成本。spa

(2)標準協議快速接入server

提供基於unimrcp框架開發的mrcpserver服務接入包,經過標準協議適配不一樣呼叫中心設備(主流的freeswitch、avaya、及基於mrcp標準協議自主研發的呼叫中心設備)。htm

(3)場景定製服務提高效果blog

方案中自帶基於百度大腦呼叫中心下的通用ASR、語義糾錯,打斷策略,TTS模型,也能夠基於開發者的業務場景,提供模型定製訓練服務,定向提高業務準確率。排序

(4)極少許開發,輕鬆實現對話流程

提供Taskflow配置管理能力,開發者可在梳理業務流程後,經過少許代碼快速配置對應的對話流程,後續可直接零代碼在UNIT平臺上進行拖拽式配置。

image.png

【語音語義一體化方案解讀】

(1)語音識別ASR

採用領先的百度語音技術,實時將音頻流轉識別出文本,並自動識別斷句。

(2)全雙工對話能力

創建通用機制,組織多模塊協同工做,實現雙通道數據(文本、事件信號)實時分發及處理。

(3)糾錯

根據場景相關詞彙生成糾錯候選,利用GBDT模型對獲選打分排序,最後經過beam search解碼出最優糾錯結果。

(4)打斷

採用分類模型實現,判斷是否知足打斷條件,並下發打斷信號,可支持用戶自定義語料的模型訓練。

(5)靜默及反問

在設定時間內用戶未回覆狀況下,機器人可自動反問。可支持用戶對時間條件、機器人反問話術進行配置。

(6)掛機、轉人工

定義標準事件信號:掛機、轉人工。用戶可經過配置、或簡單二次開發完成判斷條件的設定。

(7)對話理解

基於UNIT強大的語義理解能力,從實時文本中,解析用戶意圖。

(8)對話邏輯引擎

以可編程的方式構業務建對話邏輯。

(9)語音合成TTS

基於深度神經網絡技術,提供高度擬人,流暢天然的語音合成服務,便於應用、設備開口說話,更具個性。

【如何獲取語音語義一體化能力】

開發者能夠進入UNIT官網——解決方案——語音語義一體化方案頁面,瞭解技術詳情並體驗真實對話樣例。https://ai.baidu.com/unit/v2/static/voice

一、方案瞭解

image.png

二、真實對話樣例的體驗

image.png

若是您的產品或項目須要使用語音語義一體化方案,請在上述頁面下方點擊「聯繫咱們」。

點擊閱讀上一篇相關文章:

百度大腦UNIT3.0解讀之對話式文檔問答——上傳文檔獲取對話能力