用於大規模圖像縮放識別的Vision Transformer

在本文中,主要在不作太多技術細節的情況下,解釋2021 ICLR會議的新論文「an-image-is-worth-16x16-words-transformers-for-image-recognition-at-scale」的研究成果。 自1960年以來深度學習就已經問世,但促使深度學習真正來到了前列的,是2012年的AlexNet模型,一個卷積網絡,由Alex Krizhevsky設計,贏得了
相關文章
相關標籤/搜索