DB算法分析《Real-time Scene Text Detection with Differentiable Binarization》

  算法架構圖: 算法分析 總覽,主要包含三個部分: backbone提取特徵(特徵金字塔) 特徵金字塔被上採樣到相同尺度構建一個特徵圖F 使用F來預測概率圖P和閾值圖T,並通過P和T來生成二值圖B 一些細節: 預設的圖片大小【640,640】 在訓練階段:P、T、B都會進行loss計算,並bp,其中P、B會使用相同的標籤 在推理階段,P、B都可以被用於計算bbox DB模塊的優勢: 幫助區分非常
相關文章
相關標籤/搜索