【OCR技術系列之三】大批量生成文字訓練集

放假了,終於能夠繼續能夠靜下心寫一寫OCR方面的東西。上次談到文字的切割,今天打算總結一下咱們怎麼獲得用於訓練的文字數據集。若是是想訓練一個手寫體識別的模型,用一些前人收集好的手寫文字集就行了,好比中科院的這些數據集。可是若是咱們只是想要訓練一個專門用於識別印刷漢字的模型,那麼咱們就須要各類印刷字體的訓練集,那怎麼獲取呢?藉助強大的圖像庫,本身生成就好了!php 先捋一捋思路,生成文字集須要什麼步
相關文章
相關標籤/搜索