Datawhale 零基礎⼊⻔CV-Task3 字符識別模型

現在的顯示屏,分辨率基本都可以達到1920×1080,加上RGB三通道,一張屏幕截圖的數據量就可以達到六百多萬,如果一秒三十張圖片,那麼一秒鐘的數據量就有一億八千多萬。 神經網絡的工作方式就是仍給網絡一堆特徵值,然後網絡去學習,調整各種超參數,直到在過擬合與欠擬合之間找到平衡點。 嚴格而死板的方法,每個像素點都是特徵值,那計算機視覺簡直就是數據爆炸,比核武器還誇張,完全沒有指導意義。 卷積網絡就應
相關文章
相關標籤/搜索