出品 | AI科技大本營
php
頭圖 | CSDN付費下載於視覺中國數據庫
近日,在國際頂尖人工智能競賽第九屆對話系統技術挑戰賽(DSTC9)中,滴滴語音和NLP技術團隊參與端到端多領域面向任務型對話系統任務榮獲世界第一,充分彰顯滴滴公司在天然語言對話領域的創新能力。安全
對話系統技術挑戰賽(DSTC)旨在解決時下最前沿、最具挑戰性的對話系統技術問題,在對話領域具備極高的權威性,迄今已舉辦九屆。本屆DSTC9由微軟、Google、IBM研究院、Amazon、CMU、清華大學等聯合舉辦,吸引了業界和學術界各路頂尖團隊紛紛參與。滴滴參與的端到端多領域面向任務型對話系統(End-to-end Multi-domain Task Completion Dialog)賽道共吸引全球60多支團隊參賽。框架
多領域面向任務型對話系統指經過人機對話旨在幫助用戶完成實際具體的任務,好比在連續對話中完成訂酒店,機票、餐廳等多項任務。這次比賽所用的MultiWoz公開數據集共跨七個領域,每一個對話平均13輪。該比賽要求系統不只要從人類複雜多變的表達中快速理解意圖,還能在多領域中穿插切換,給予準確合適的回答,最終完成任務。這也對現有任務型對話系統提出更高要求。dom
在比賽中,滴滴使用了HybridDTA模型,採用領域自適應(Domain Adaptive)以及任務自適應學習(Task Adaptive)混合技術,經過大規模domain數據預訓練、任務分階段多目標學習、領域自適應去詞化預處理和後處理等,讓模型可跨領域學習任務型對話系統的推理過程。性能
滴滴HybridDTA模型框架圖
學習
而爲了讓系統回答更加智能接近人類,滴滴模型在端到端GPT2模型基礎上加入基於對話領域的數據預訓練,並採用一系列容錯後處理矯正機制改進最終結果。最終取得人工評測任務成功率(Average Success Rate)世界第一,相對DSTC8同任務提高了近9個百分點,其中人工評測系統回答合適分數相較DSTC8提高了3.8%,意味着人機對話的理解力和回覆能力在多領域任務達到新的高度。人工智能
目前,這一語音對話系統已在滴滴普遍使用,如智能客服對話、車機系統語音交互、司機端內語音交互等。除積極探索技術前沿,滴滴也持續推動對話交互能力的開放,除去年8月,開源基於深度學習的天然語言平臺DELTA,進一步下降開發者建立、部署天然語言處理系統和語音模型的難度以外,上週,滴滴還聯合天津大學、杜克大學開放了大規模數據庫,提供由超過6000名說話人專門錄製的近800小時的語音數據和註音標註。.net
更多精彩推薦