百度AI閃耀ACL2020:展示多項前沿技術、舉辦首屆機器同傳研討會

歡迎關注【百度NLP】官方公衆號,及時獲取更多業界前沿技術!


近日,第58屆國際計算語言學協會年會ACL 2020(The Association for Computational Linguistics)於線上開啓。此次會議,百度共有11篇論文被錄用,覆蓋天然語言處理衆多前沿研究方向;百度聯合谷歌、Facebook、清華大學等全球頂尖機構,共同舉辦首屆同聲傳譯研討會;在線上展臺主題技術TALK環節,百度還就開放域人機對話技術、ERNIE核心技術等業內關注的話題展開分享,展示了中國企業在天然語言處理及人工智能領域的技術創新與落地實踐能力。算法

ACL成立於1962年,是天然語言處理領域影響力最大、最具活力的國際學術組織之一。自成立之日起,致力於推進計算語言學及天然語言處理相關研究的發展和國際學術交流。百度的天然語言處理技術,在技術創新及應用上始終保持領先,一直被視爲天然語言處理研究界的「第一梯隊」,這次在ACL 2020大會中的亮眼表現,正是源於百度在技術領域的長期積累。編程

百度11篇論文被收錄,紮實AI技術彰顯國際影響力網絡

ACL2020共收錄百度11篇論文架構

除了在國際AI學界的影響力外,ACL不管是審稿規範仍是審稿質量,都是當今AI領域國際頂級會議中公認的翹楚。框架

本屆大會百度共有11篇論文被收錄,覆蓋了人機對話系統、情感分析/預訓練表示學習、NLP文本生成與摘要、機器翻譯/同聲翻譯、知識推理、AI輔助臨牀診斷等諸多天然語言處理界的前沿研究方向,提出了包括端到端開放域生成模型PLATO、面向開放域對話的基於圖譜的對話管理機制、情感知識加強的語言模型預訓練方法、基於圖表示的多文檔生成式摘要方法GraphSum等諸多新框架、新算法、新數據,不只極大提高了相關領域的研究水平,也將推進人機交互、機器翻譯、智慧醫療等場景的技術落地應用。學習

這次ACL 2020的審稿週期,從去年12月一直持續到今年4月,相比往年幾乎增長了一倍。會議投稿數量爲3088篇,共有77篇論文被接收,包括571篇長論文和208篇短論文,接收率僅爲25.2%。百度11篇論文被收錄的成績,不只意味着研究成果獲得了國際學術界的承認,也證實了其研究自己在實驗嚴謹性、思路創新性等方面的實力。優化

領銜舉辦ACL 2020首屆機器同傳研討會,百度技術領先性獲得公認ui

同聲傳譯以其高效的信息傳遞方式,普遍應用於國際會議、商務會談、新聞發佈、法律訴訟等多種跨語言交流場景。機器同傳結合了機器翻譯(Machine Translation)、語音識別(Automatic Speech Recognition)和語音合成(Text-To-Speech)等人工智能技術,已經成爲重要的前沿研究領域。目前,機器同傳還須要攻克高魯棒性、高翻譯質量、低延時的相關問題。人工智能

本次會議中,百度聯合國內外頂尖企業和高校共同舉辦全球首屆同聲傳譯研討會,聚集包括機器翻譯、語音處理和人類口譯領域的研究和從業人員,共同就機器同傳架構、翻譯模型、數據資源等問題展開研討。spa

百度技術委員會主席、百度天然語言處理首席科學家吳華受邀作線上報告

研討會有多場高質量主題演講,百度技術委員會主席、百度天然語言處理首席科學家吳華等國內外多名專家就機器同傳研究現狀、面臨挑戰以及將來發展進行探討,加深了機器同傳與口譯兩個領域之間的交流,極大地推進了機器同傳技術發展以及機器和人工同傳的協同合做。

在本次研討會同期舉辦的國際首屆同傳評測比賽中,百度行業首發業內最大規模面向真實場景的中英同傳數據,涵蓋信息技術、經濟、文化、生物、藝術等多個領域。同時,基於百度深度學習平臺飛槳的一站式AI開發實訓平臺百度大腦AI Studio,百度爲參賽選手提供在線編程環境、免費GPU算力、海量開源算法和開放數據,幫助開發者快速建立和部署模型。

展示多個技術亮點,百度線上展臺主題技術TALK引關注

在本次大會的線上展臺主題技術TALK環節,百度也展示出多個亮點,體現出百度領先的技術創新與落地實踐能力,圍繞ERNIE核心技術、開放域人機對話技術、智慧醫療、生物醫藥等業內關注的話題,百度獻上了精彩的演講。

在展臺主題技術TALK環節,百度研究人員作出主題爲《ERNIE的技術原理、平臺與應用》的分享。百度提出了知識加強的語義表示模型ERNIE及持續學習語義理解框架ERNIE 2.0,在16箇中英文任務上超越國際最好效果,取得了SOTA的效果。去年12月,ERNIE在國際權威的通用語言理解評估基準GLUE上首次突破90大關,超越人類三個點,取得全球第一。今年3月,在全球最大規模的國際語義評測SemEval上得到5項世界冠軍。

近期,百度又相繼發佈了面向生成的預訓練技術ERNIE-Gen和知識加強的視覺-語言預訓練模型ERNIE-ViL。ERNIE-Gen首次提出基於多流機制生成完整語義片斷,在5個生成類任務上取得了SOTA效果。ERNIE-ViL首次將場景圖知識融入多模態預訓練, 刷新了5項多模態任務紀錄,並登頂權威榜單VCR。在剛剛舉行的世界人工智能大會上,百度文心(ERNIE)知識加強語義理解技術與平臺得到了大會最高榮譽獎項「卓越人工智能引領者」(SAIL)獎。

在《基於意圖圖譜的開放域對話生成框架》分享中,百度研究人員介紹到,爲了提高多輪對話下的總體對話質量,提出基於意圖圖譜的對話生成框架,在該框架中引入顯式的對話管理機制,以加強對多輪對話流的控制能力。在公開數據集上的實驗結果代表,以上模型或系統在主題連貫性、對話目標引導成功率等關鍵多輪效果指標上顯著超越基線模型。

同時,百度藉助此次展臺技術Talk發佈了業界首個基於隱變量的大規模對話模型PLATO以及基於PLATO相關工做擴展升級的PLATO-2。該模型使用了最多16億參數,發佈了中英文版本。其中,英文效果超越了Google的Meena和Facebook AI Research的Blender,中文模型也遠超過現有基線。

在主題爲《基於計算語言學的新冠病毒分析和疫苗設計算法》的分享中,針對新冠疫情,百度研究人員把天然語言處理領域的經典句法分析算法移植到核酸序列結構分析,介紹了全球首個線性時間的RNA結構預測算法LinearFold,能夠將新冠病毒基因組全序列結構分析的時間從55分鐘下降到27秒。在此基礎上,百度還研發出了全球首個mRNA疫苗序列設計算法LinearDesign,能夠設計出結構最穩定的疫苗序列。對於新冠S蛋白,該算法16分鐘內就可設計出優化疫苗序列,解決了mRNA疫苗研發中的一個重大難題。目前,百度正在積極推動和中國疾控中心、各大疫苗公司和科研機構的合做。

在主題爲《天然語言處理和知識圖譜技術在臨牀輔助決策中的應用研究》的演講中,百度研究人員分享了靈醫智惠在臨牀輔助決策中應用。以百度世界領先的中文天然語言處理和知識圖譜等技術爲基礎,靈醫智惠打造了強大的醫療認知計算能力,造成了醫療場景下的語言、知識和認知計算三位一體的臨牀輔助決策引擎。

近年來,中國AI企業、開發者及高校在國際AI頂會上的表現也愈發亮眼。ACL2020大會中,不管是論文入選量、領銜舉辦研討會、同傳比賽,百度都展示出中國AI行業頭雁的實力。百度NLP是百度AI技術和應用的萌芽起點和帶動力量,始終聚焦核心前沿,持續引領技術創新,持續引領中國NLP技術發展方向,不只爲這次大會交上了一份滿意的答卷,也爲中國AI崛起、走向世界發展貢獻了重要的力量。

推薦閱讀

百度11篇論文被國際天然語言處理頂級會議ACL 2020錄用

對話智能新高度:百度發佈超大規模開放域對話生成網絡PLATO-2

百度文心(ERNIE)榮獲2020世界人工智能大會最高榮譽SAIL獎

百度天然語言處理(Natural Language Processing,NLP)以『理解語言,擁有智能,改變世界』爲使命,研發天然語言處理核心技術,打造領先的技術平臺和創新產品,服務全球用戶,讓複雜的世界更簡單。

相關文章
相關標籤/搜索