場景文本識別模型綜述

1、數據集的分析 (一) 訓練數據集 大多數天然場景文字識別算法使用合成數據進行訓練。兩個經常使用的合成數據集是 MJSynth(MJ) 和 SynthText(ST) ,分別包含890萬和550萬張訓練樣本。web 圖1 不一樣比例的訓練數據集(MJ+ST)與算法識別性能 結論:算法 天然場景文字識別算法的性能隨着數據量的增多而改善。 在不一樣訓練數據集下訓練的模型,彼此不具備可比性。 數據的多
相關文章
相關標籤/搜索