做爲人工智能時代的基礎,深度學習一直是人工智能最熱門、企業投入最多的研究領域之一,百度PaddlePaddle深度學習框架應運而生,這是國內惟一一家擁有自主知識產權的開源深度學習框架。在此框架中,匯聚了更多的AI科學家、架構師、AI愛好者,設置常規賽,提供豐富的真實數據,多樣的算法賽題,顯示百度對深度學習框架戰略地位的重視,讓AI愛好者可以獲得更多真實場景的練習機會和更多PaddlePaddle的實際訓練經驗,這勢必推進PaddlePaddle更普遍、更深刻地用於人工智能研發及落地應用。算法
目前已推出2個賽題,從最多見的文檔提取概括總結出發,涉及汽車以及中文閱讀領域,不管是從賽事的設計理念,仍是對技術能力的把握,這次常規賽都將對PaddlePaddle的推廣和使用產生深遠的影響。以後PaddlePaddle將會持續推出更多主題的常規賽,讓咱們拭目以待。架構
賽題一:汽車大師問答模型賽框架
【賽題簡介】學習
汽車大師是一款經過在線諮詢問答爲車主解決用車問題的APP,致力於作車主身邊靠譜的用車顧問,車主經過汽車大師用語音、文字或圖片發佈汽車問題,系統爲其匹配專業技師提供及時有效的諮詢服務。因爲平臺用戶基數衆多,重複回答和持續時間長的多輪問詢花去汽修技師大量時間,也使用戶獲取解決方案的時間變長,對雙方來講都存在資源浪費的狀況。爲了節省更多人工時間,提升用戶獲取回答和解決方案的效率,要求選手們使用汽車大師提供的11萬條技師與用戶的多輪對話與診斷建議報告數據創建模型,從而可基於對話文本、用戶問題、車型與車系,輸出包含摘要與推斷的報告文本,考驗模型的概括總結與推斷能力。人工智能
汽車大師比賽樣例項目: http://aistudio.baidu.com/aistudio/#/projectdetail/27113
汽車大師比賽數據集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1407spa
賽題二:NLP智能問答賽設計
【賽題簡介】圖片
BROAD中包含着迄今爲止規模最大的中文公開領域閱讀理解數據集,DuReader。該數據集基於真實應用需求,全部問題均來源於百度搜索用戶的真實問題,文檔來自全網真實採樣的網頁文檔和百度知道 UGC 文檔,答案基於問題與文檔由人工撰寫生成。數據集標註了問題類型、實體和觀點等豐富信息,彌補了現有主流數據集對於觀點類問題覆蓋不足的問題。要求選手們依據BROAD開放數據集中全球最大中文閱讀理解數據集創建基於文本與問題,輸出正確答案的模型,考驗模型的概括總結與改述能力。資源
機器閱讀理解樣例項目:文檔
http://aistudio.baidu.com/aistudio/#/projectdetail/27131
數據集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1410
賽程及獎項設置
比賽從2018年9月28日開始,直到賽題下線。常規賽不設初賽複賽,以當月每位參賽選手提交的最優成績排名。這期間選手天天可提交5次做品,當評分優於baseline Model成績,則認定挑戰成功,便可中止提交。選手可同時參加多場比賽。
具體詳情請看官網:http://aistudio.baidu.com/aistudio/#/competition
(點擊AI Studio官網-比賽-比賽列表-選取要參加的比賽)
PaddlePaddle期待與全球AI愛好者們一塊兒打造世界頂級深度學習框架,共同推進AI技術的進步。