ArXiv Weekly Radiostation:NLP、CV、ML 更多精選論文(附音頻)
論文 1:Towards Playing Full MOBA Games with Deep Reinforcement Learning
多人在線競技類遊戲 MOBA 長久以來一直吸引着衆多玩家,其中的王者榮耀、英雄聯盟、Dota 2 等最近也常被 AI 研究者當作人工智能的實驗場,其中的多智能體、巨大的狀態動做空間、複雜的環境等元素向 AI 系統提出了極大的挑戰。開發用於 MOBA 遊戲的 AI 引發了普遍的關注。然而,當 OpenAI 的 Dota AI 將遊戲限制在只能選擇 17 名英雄的狀況下,若想擴展英雄庫,現有的工做在處理由智能體組合(即陣容)爆炸性增加所致使的遊戲複雜性方面的問題存在難度。所以,現有的 AI 系統並不能掌握徹底沒有限制的 MOBA 遊戲。
在日均活躍玩家數量超 1 億的國民手遊王者榮耀上進行測試,展現了人類能夠打造出可以擊敗頂級電子競技玩家的超級 AI 智能體。經過文獻中首次對
MOBA AI 智能體進行大規模性能測試,證實了該 AI 的優越性
curriculum self-play 學習流程圖。
論文 2:Long Range Arena : A Benchmark for Efficient Transformers
Transformer 在多個模態(語言、圖像、蛋白質序列)中得到了 SOTA 結果,但它存在一個缺點:自注意力機制的平方級複雜度限制了其在長序列領域中的應用。目前,研究人員提出大量高效 Transformer 模型(「xformer」),試圖解決該問題。其中不少展現出了媲美原版 Transformer 的性能,同時還能有效下降自注意力機制的內存複雜度。
谷歌和 DeepMind 的研究人員提出了
一個新基準 Long-Range Arena (LRA),用來對長語境場景下的序列模型進行基準測試
。該基準包括合成任務和現實任務,研究人員在此基準上對比了十個近期提出的高效 Transformer 模型,包括 Sparse Transformers、Reformer 、Linformer、Longformer、Sinkhorn Transformer、Performer、Synthesizer、Linear Transformer 和 BigBird 模型。
論文 3:Sparse R-CNN: End-to-End Object Detection with Learnable Proposals
沿着目標檢測領域中 Dense 和 Dense-to-Sparse 的框架,
Sparse R-CNN 創建了一種完全的 Sparse 框架
, 脫離 anchor box,reference point,Region Proposal Network(RPN) 等概念,無需 Non-Maximum Suppression(NMS) 後處理, 在標準的 COCO benchmark 上使用 ResNet-50 FPN 單模型在標準 3x training schedule 達到了 44.5 AP 和 22 FPS。
RetinaNet、Faster R-CNN 與 Sparse R-CNN 的比較。
Sparse R-CNN 架構 pipeline。
論文 4:The Mathematical Foundations of Manifold Learning
流形學習(manifold learning)是機器學習、模式識別中的一種方法,在維數約簡方面具備普遍的應用。它的主要思想是將高維的數據映射到低維,使該低維的數據可以反映原高維數據的某些本質結構特徵。流形學習的前提是有一種假設,即某些高維數據,實際是一種低維的流形結構嵌入在高維空間中。流形學習的目的是將其映射回低維空間中,揭示其本質。流形學習能夠做爲一種數據降維的方式。此外,流形可以刻畫數據的本質,主要表明方法有等距映射、局部線性嵌入等。自 2000 年在著名的科學雜誌《Science》首次提出以來,流形學習成爲機器學習領域中的一個熱點。
Luke Melas-Kyriazi 現爲牛津大學博士 。
論文 5:Learning to Reconstruct and Segment 3D Objects
今年九月畢業於牛津大學計算機科學系的博士生 Bo Yang 在其畢業論文《Learning to Reconstruct and Segment 3D Objects》中對這一主題展開了研究。與傳統方法不一樣,做者經過在大規模真實世界的三維數據上訓練的深度神經網絡來學習通用和魯棒表示,進而理解場景以及場景中的物體。整體而言,本文開發了一系列新型數據驅動算法,以實現機器感知到真實世界三維環境的目的。做者表示:「本文能夠說是突破了人工智能和機器理解的界限。」
論文 6:U2 -Net: Going Deeper with Nested U-Structure for Salient Object Detection
摘要:從人臉圖片生成藝術肖像畫的 AI 應用不在少數,但效果驚豔的很少。上面這張圖片中的輸入 - 輸出結果,來源於一個 GitHub 熱門項目 U^2-Net (U square net),開源至今已經得到了 1.7K 的 star 量。這項研究來自阿爾伯塔大學的一個團隊,論文此前已被國際模式識別大會 ICPR 2020 會議接收。
U^2-Net 是一個簡單而強大的深度網絡架構,其架構是兩層嵌套的 U 形結構
。該研究提出的 ReSidual U-block(RSU)中混合了不一樣大小的接收域,所以它可以從不一樣尺度中捕獲更多的語境信息。此外,RSU 中使用了池化操做,所以在不顯著增長計算成本的狀況下,也可以增長整個架構的深度。
U^2-Net 與其餘 SOTA SOD 模型的比較。
論文 7:Stylized Neural Painting
密歇根大學安娜堡分校、網易伏羲 AI 實驗室等機構的研究者提出了一種圖像轉油畫的轉換方法,該方法能夠生成風格可控的生動逼真油畫做品
ArXiv Weekly Radiostation
機器之心聯合由楚航、羅若天發起的ArXiv Weekly Radiostation,在 7 Papers 的基礎上,精選本週更多重要論文,包括NLP、CV、ML領域各10篇精選,並提供音頻形式的論文摘要簡介,詳情以下:
