《ResNeSt: Split-Attention Networks》筆記

Introduction NAS系列方法大大提升了圖片分類的精度,但是這些NAS系列方法是基於特定任務搜索出來的網絡結構,提取出來的特徵泛化性不高。而且NAS系列模型的訓練效率和內存使用效率不高。NAS系列模型消耗很多內存,有些大模型不能使用合適的batch-size在GPU上訓練。這限制了NAS系列模型用於其他應用,比如需要密集預測的分割任務。大多數針對計算機視覺任務的工作依然使用ResNet模
相關文章
相關標籤/搜索