用於大規模圖像縮放識別的Vision Transformer

時間 2021-07-13

原文原文鏈接

在本文中，主要在不作太多技術細節的情況下，解釋2021 ICLR會議的新論文「an-image-is-worth-16x16-words-transformers-for-image-recognition-at-scale」的研究成果。自1960年以來深度學習就已經問世，但促使深度學習真正來到了前列的，是2012年的AlexNet模型，一個卷積網絡，由Alex Krizhevsky設計，贏得了

>>阅读原文<<