文字檢測算法CTPN網絡模型及tensorflow版本代碼介紹

網絡結構: 1、基礎網絡時VGG16,在conv5_3卷積之後的特徵圖上進行後續處理 2、在conv5_3的特徵圖之上,使用3x3的卷積核進行滑窗處理,這就是Faster R-CNN中使用的RPN網絡 3、然後以特徵圖的行爲單位,將每行內容分別輸入到雙向LSTM循環網絡中,將雙向循環網絡的輸出結果進行concat連接,每個LSTM輸出的結果是128維向量,所以每個位置的輸出結果是256維的向量,得
相關文章
相關標籤/搜索