滴滴開源DELTA:AI開發者可輕鬆訓練天然語言模型

8月2日消息,天然語言處理領域頂級會議ACL2019在乎大利弗洛倫薩繼續召開。會上滴滴正式宣佈開源基於深度學習的語音和天然語言理解模型訓練平臺DELTA,以進一步幫助AI開發者建立、部署天然語言處理和語音模型,構建高效的解決方案,助力NLP應用更好落地。git

 

DELTA是滴滴第22個開源項目。天然語言處理模型和語音模型是不少AI系統與用戶交互的接口,這次滴滴正式這一開源深度學習模型訓練框架,旨在進一步下降開發者建立、部署天然語言處理系統和語音模型的難度。github

 

滴滴天然語言處理首席科學家Kevin Knight在ACL2019現場算法

 

DELTA主要基於TensorFlow構建,能同時支持NLP(天然語言處理)和語音任務及數值型特徵的訓練。整合了包括文本分類、命名實體識別、天然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等重要算法模型,造成一致的代碼組織架構,總體包裝統一接口。架構

 

用戶準備好模型訓練數據,並指定好配置Configuration,模型訓練pipeline能夠根據配置進行數據處理,並選擇相應的任務和模型,進行模型訓練。在訓練結束以後,自動生成模型文件保存。該模型文件造成統一接口,能夠直接上線使用,快速產品化,能讓從研究到生產變得更容易。框架

 

 

值得注意的是,除可支持多種模型的訓練,DELTA還支持靈活配置,開發者可基於DELTA搭建成多達幾十種的複雜的模型;此外,DELTA在多種經常使用任務上提供了穩定高效的benchmark,用戶能夠簡單快速的復現論文中的模型的結果,同時也能夠在此基礎上擴展新的模型。在模型構建完成後,用戶可使用DELTA的部署流程工具,迅速完成模型上線。從論文到產品部署無縫銜接。工具

 

目前AI開發者可登錄Github(https://github.com/didi/delta)查看DELTA的詳細介紹和源代碼,利用DELTA加快實驗進度,部署用於文本分類、命名實體識別、天然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等任務的系統。用戶亦可在滴滴的開源平臺上(https://didi.github.io/)獲取更多滴滴開源項目的相關信息。學習

 

實際上,NLP和語音技術在滴滴已經有普遍的應用。經過大量應用了包括天然語言處理、深度學習、知識圖譜、語音、推薦等技術,滴滴自建了基於AI的智能客服系統,能利用人工智能技術輔助人工客服,提升人工客服處理問題的效率,並減小人工客服在重複、簡單問題上的處理量。此外,基於語音識別以及天然語言理解技術,滴滴也在構建駕駛員語音助手,日本和澳洲的滴滴司機即將能用語音直接「免接觸」接單。而在將來,這一語音助手也將支持全方位的語音交互服務,包括影音娛樂、信息查詢、車內環境調節,到乘客通訊、客服,甚至是加油、充電或維保服務。與此同時,滴滴也在積極推動相關能力的開放,經過提供一站式天然語言處理工具、一站式機器人開放平臺,幫助行業合做夥伴更好地實現AI應用落地。人工智能

相關文章
相關標籤/搜索