AMiner平臺(https://www.aminer.cn)由清華大學計算機系研發,擁有我國徹底自主知識產權。平臺包含了超過2.3億學術論文/專利和1.36億學者的科技圖譜,提供學者評價、專家發現、智能指派、學術地圖等科技情報專業化服務。系統2006年上線,吸引了全球220個國家/地區1000多萬獨立IP訪問,數據下載量230萬次,年度訪問量超過1100萬,成爲學術搜索和社會網絡挖掘研究的重要數據和實驗平臺。web
目標檢測(Object Detection)是計算機視覺和數字圖像處理的一個熱門方向,普遍應用於機器人導航、智能視頻監控、工業檢測、航空航天等諸多領域,經過計算機視覺減小對人力資本的消耗,具備重要的現實意義。所以,目標檢測也就成爲了近年來理論和應用的研究熱點,它是圖像處理和計算機視覺學科的重要分支,也是智能監控系統的核心部分,同時目標檢測也是泛身份識別領域的一個基礎性的算法,對後續的人臉識別、步態識別、人羣計數、實例分割等任務起着相當重要的做用。因爲深度學習的普遍運用,目標檢測算法獲得了較爲快速的發展。算法
根據AMiner-NeurIPS 2020詞雲圖和論文能夠看出,與Object Detection是在本次會議中的熱點,下面咱們一塊兒看看Object Detection主題的相關論文。微信
1.論文名稱:Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection網絡
論文連接:https://www.aminer.cn/pub/5edf5dd891e011bc656dee5b?conf=neurips2020框架
簡介:一級檢測器基本上將對象檢測公式化爲密集的分類和定位。一般經過焦點損失來優化分類,而且一般在Dirac delta分佈下了解盒子的位置。一級檢測器的最新趨勢是引入單個預測分支來估計定位質量,其中預測質量有助於分類以提升檢測性能。本文研究了以上三個基本元素的表示形式:質量估計,分類和本地化。在現有實踐中發現了兩個問題,其中包括:(1)訓練和推理之間質量估計和分類的用法不一致,以及(2)當複雜場景中存在歧義和不肯定性時,用於位置定位的Dirac delta分佈不靈活。爲了解決這些問題,咱們爲這些元素設計了新的表示形式。具體來講,咱們將質量估計值合併到類預測向量中,以造成定位質量和分類的聯合表示,並使用向量表示框位置的任意分佈。改進的表示法消除了不一致的風險,並準確地描述了實際數據中的靈活分佈,可是包含連續的標籤,這超出了焦點損失的範圍。而後,咱們提出廣義焦點損失(GFL),將焦點損失從離散形式推廣到連續版本,以實現成功的優化。svg
2.論文名稱:Fine-Grained Dynamic Head for Object Detection函數
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f0828397bae?conf=neurips2020工具
簡介:特徵金字塔網絡(FPN)提出了一種出色的方法,能夠經過執行實例級別的分配來減輕對象表示中的比例差別。然而,這種策略忽略了實例中不一樣子區域的獨特特徵。爲此,咱們提出了一種細粒度的動態頭,能夠針對每種狀況從不一樣的比例有條件地選擇FPN特徵的像素級組合,從而進一步釋放了多比例特徵表示的能力。此外,咱們設計了具備新激活函數的空間門,以經過空間稀疏卷積顯着下降計算複雜性。大量的實驗證實了該方法在幾種最新檢測基準上的有效性和效率性能
3.論文名稱:UWSOD: Toward Fully-Supervised-Level Capacity Weakly Supervised Object Detection學習
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f08283979f9?conf=neurips2020
簡介:弱監督對象檢測(WSOD)因爲其利用僅具備圖像級註釋的大規模數據集進行檢測器訓練的巨大靈活性而引發了普遍的研究關注。儘管近年來取得了長足的進步,但WSOD的性能仍然有限,遠低於徹底監督對象檢測(FSOD)的性能。因爲大多數WSOD方法都依賴於對象提議算法來生成候選區域,而且還面臨着諸如質量低下的預測邊界框和大規模變化之類的挑戰。在本文中,咱們提出了一個統一的WSOD框架(稱爲UWSOD),以開發僅包含圖像級標籤的大容量通用檢測模型,該模型是獨立的,不須要外部模塊或其餘監督。爲此,咱們利用了三個重要的組件,即對象提案生成,邊界框微調和尺度不變特徵。首先,咱們提出一個基於錨點的自我監督的提議生成器來假設對象位置,該生成器由UWSOD建立的監督進行端到端的訓練,以進行對象分類和迴歸。其次,咱們經過逐步選擇高可信度對象建議做爲正樣本,開發了逐步的邊界框微調,以精煉檢測分數和座標,從而引導了預測邊界框的質量。第三,咱們構造了一個多速率重採樣金字塔以聚合多尺度上下文信息,這是第一個處理WSOD中尺度變化的網絡內特徵層次結構。在PASCAL VOC和MS COCO上進行的大量實驗代表,所提出的UWSOD使用最新的WSOD方法可得到競爭性結果,而無需外部模塊或額外的監督。此外,具備類不可知的地面真相邊界框的UWSOD的上限性能接近Faster R-CNN,這代表UWSOD具備徹底受監督級別的能力。
4.論文名稱:CoADNet: Collaborative Aggregation-and-Distribution Networks for Co-Salient Object Detection
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f0828397c71?conf=neurips2020
簡介:共凸對象檢測(CoSOD)旨在發如今包含兩個或多個相關圖像的給定查詢組中重複出現的凸對象。一個具備挑戰性的問題是如何經過建模和利用圖像間關係來有效地捕捉共顯性線索。在本文中,咱們提出了一個端到端的協做聚合和分發網絡(CoADNet),以捕獲來自多個圖像的顯着和重複的視覺模式。首先,咱們將顯着性先驗集成到骨幹特徵中,以經過在線顯着性內部指導結構抑制多餘的背景信息。以後,咱們設計了一個兩階段的彙集和分佈體系結構,以探索逐組語義交互併產生共顯性特徵。在第一階段,咱們提出了一個基於組的語義聚合模塊,該模塊對圖像間的關係進行建模以生成按組的語義表示。在第二階段,咱們提出了門控組分配模塊,該模塊以動態門控機制將學習到的組語義自適應地分配給不一樣的個體。最後,咱們開發了針對CoSOD任務量身定製的保持組一致性的解碼器,該解碼器在特徵解碼期間維持了組約束,以預測更一致的全分辨率共顯性圖。擬議的CoADNet在四個主要的CoSOD基準數據集上進行了評估,這代表與十個最新競爭對手相比,性能獲得了顯着提升
5.論文名稱:Comprehensive Attention Self-Distillation for Weakly-Supervised Object Detection
論文連接:https://www.aminer.cn/pub/5f7fdd328de39f0828397aab?conf=neurips2020
簡介:弱監督對象檢測(WSOD)已成爲僅使用圖像級類別標籤來訓練對象檢測器的有效工具。可是,若是沒有對象級別的標籤,WSOD檢測器很容易檢測到顯着對象,聚類對象和區分對象部分上的邊界框。此外,圖像級別類別標籤不會在同一圖像的不一樣變換之間強制執行一致的對象檢測。爲了解決上述問題,咱們爲WSOD提出了一種綜合注意自我蒸餾(CASD)培訓方法2。爲了在全部對象實例之間平衡特徵學習,CASD計算來自同一圖像的多個變換和特徵層的綜合注意力。爲了對對象執行一致的空間監視,CASD在WSOD網絡上進行自我蒸餾,以便經過同一圖像的屢次變換和特徵層同時近似全面關注。
根據主題分類查看更多論文,掃碼進入NeurIPS2020會議專題,最前沿的研究方向和最全面的論文數據等你來~
掃碼瞭解更多NeurIPS2020會議信息
添加「小脈」微信,留言「NeurIPS」,便可加入【NeurIPS會議交流羣】,與更多論文做者學習交流!
訂閱瞭解更多論文信息,定製您的我的科研動態信息流:https://www.aminer.cn/user/notification?f=mt
本文同步分享在 博客「AMiner科技」(CSDN)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。