CCAI 2020年8月29日-30日
2020年中國人工智能大會(Chinese Congress on Artificial Intelligence 2020,簡稱「CCAI 2020」)將於8月29日-30日在南京召開。CCAI 2020以「智周萬物」爲主題,探討人工智能做爲引領將來的戰略性技術,如何以周知萬物的學術境界賦能將來,帶動時代發展,實現互聯世界的遠大理想。算法
東南大學計算機學院、軟件學院院長、人工智能學院執行院長,國家優青,IETI Distinguished Fellow耿新將出席本次大會並擔任《青年科學家專題論壇》論壇主席。網絡
耿新:分別於2001年和2004年在南京大學計算機科學與技術系得到學士和碩士學位,於2008年得到澳大利亞Deakin大學博士學位。建立東南大學模式學習與挖掘(PALM)實驗室並擔任實驗室主任至今。目前主要從事機器學習、模式識別、計算機視覺等方面的研究。曾獲國家級教學成果獎一等獎、教育部天然科學獎一等獎等多項教學、科研獎勵,入選國際工程與技術學會(IETI)傑出會士。曾獲國家優秀青年科學基金、江蘇省傑出青年科學基金資助,主持國家重點研發計劃課題、國家天然科學基金等多個科研項目。框架
01機器學習
Partial Multi-Label Learning with Label Distribution性能
論文地址:學習
http://palm.seu.edu.cn/xgeng/files/aaai20.pdf測試
介紹:部分多標籤學習(PML)旨在從訓練示例中學習,每一個訓練示例都與一組候選標籤相關聯,其中只有一個子集對訓練示例有效。推導預測模型的常見策略是嘗試消除候選標籤集的歧義,例如經過利用每一個候選標籤的置信度來識別真值標籤或估計候選標籤集中的噪聲標籤。儘管如此,這些策略忽略了考慮與每一個實例相對應的基本標籤分佈,由於標籤分佈在訓練集中未明確可用。本文提出了一種新的部分多標籤學習策略,稱爲PML-LD,以經過標籤加強從部分多標籤示例中學習。具體來講,經過利用特徵空間的拓撲信息和標籤之間的相關性來恢復標籤分佈。以後,經過使用恢復的標籤分佈擬合正則化的多輸出迴歸變量來學習多類預測模型。在合成數據集和實際數據集上的實驗結果清楚地證實了PML-LD解決PML問題的有效性。ui
02編碼
Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information人工智能
論文地址:http://palm.seu.edu.cn/xgeng/files/cvpr19.pdf
介紹:多人姿式估計是計算機視覺中一個重要但具備挑戰性的問題。儘管當前的方法經過融合多尺度特徵圖取得了顯著進展,但它們不多關注加強特徵圖的通道和空間信息。在本文中,咱們提出了兩個新穎的模塊來執行多人姿式估計信息的加強。首先,提出了信道混洗模塊(CSM),對不一樣層次的特徵圖採用信道混洗操做,促進了金字塔特徵圖之間的跨信道信息通訊。其次,設計了空間-通道注意力殘餘瓶頸(SCARB),以經過注意力機制加強原始殘餘單元,在空間和通道方式中自適應突出顯示特徵圖的信息。咱們提出的模塊的有效性在COCO關鍵點基準上進行了評估,實驗結果代表,咱們的方法達到了最早進的效果。
03
Label Distribution Learning on Auxiliary Label Space Graphs for Facial Expression Recognition
論文地址:
http://palm.seu.edu.cn/xgeng/files/cvpr20.pdf
介紹:現有的許多研究代表,註釋不一致在各類面部表情識別(FER)數據集中普遍存在。緣由多是人類註釋者的主觀性和表情標籤的含糊性質。解決這一問題的一種有前途的策略是最近提出的稱爲標籤分佈學習(LDL)的學習範式,該範式容許將具備不一樣強度的多個標籤連接到一個表情。可是,直接應用標籤分佈學習一般是不切實際的,由於許多現有數據集僅包含一個獨熱標籤,而不包含標籤分佈。爲了解決該問題,咱們提出了一種名爲「在輔助標籤空間圖上進行標籤分佈學習」(LDL-ALSG)的新穎方法,該方法利用了來自相關但更獨特的任務(例如動做單元識別和麪部標誌檢測)的標籤拓撲信息。基本假設是面部圖像在動做單元識別和麪部標誌檢測的標籤空間中應具備與其鄰居類似的表情分佈。咱們提出的方法在各類數據集上獲得了評估,而且始終以極大的優點賽過那些最早進的方法。
04
Practical Age Estimation Using Deep Label Distribution Learning
論文地址:
http://palm.seu.edu.cn/xgeng/files/FCS20.pdf
介紹:年齡估計在人機交互系統中起着重要做用。缺少大量的具備肯定年齡標籤的面部圖像使得年齡估計算法效率低下。事實證實,採用卷積神經網絡(CNN)和標籤分佈學習來從真實年齡和鄰近年齡學習歧義的深度分佈學習(DLDL)優於當前的最新框架。可是,DLDL假定標籤分佈很粗糙,涵蓋了任何給定年齡標籤的全部年齡。在本文中提出了一種更實用的標籤分配範式:咱們限制年齡標籤分配,使其僅涵蓋合理數量的相鄰年齡。此外,咱們探索了不一樣的標籤分佈,以提升提出的學習模型的性能。咱們採用CNN和改進的標籤分配學習方法來估算年齡。實驗結果代表,與DLDL相比,咱們的方法對面部年齡識別更爲有效。
05
Discrete Binary Coding based Label Distribution Learning
論文地址:
http://palm.seu.edu.cn/xgeng/files/ijcai19b.pdf
介紹:標籤分發學習(LDL)是機器學習中的一種通用學習範式,其特殊狀況包括單標籤學習(SLL)和多標籤學習(MLL)。最近,已經提出了許多LDL算法來處理不一樣的應用任務,例如面部年齡估計、頭部姿式估計和視覺情緒分佈預測。可是,大多數現有LDL算法的訓練時間複雜度太高,這使其不適用於大規模LDL。在本文中,咱們提出了一種新穎的LDL方法來解決此問題,稱爲基於離散二進制編碼的標籤分發學習(DBC-LDL)。具體來講,咱們設計了一個有效的離散編碼框架來學習實例的二進制代碼。此外,成對語義類似性和原始標籤分佈都集成到此框架中,以學習具備高度區分性的二進制代碼。另外,快速近似最近鄰(ANN)搜索策略用於預測測試實例的標籤分佈。在五個真實數據集上的實驗結果代表,它具備比幾種最新的LDL方法優越的性能,且具備較低的時間成本。