報紙PDF文字生成網頁版,如何對比發現錯誤、掉字

在紙媒工作了幾年,把紙媒轉成內容可複製的電子版,也不是一個新概念,市場上也有很多的一些成熟產品。 但是,前期我遇到了自動識別軟件,識別PDF後有掉字的現象,軟件是自動化的機械化的,難免出錯,出錯後我們也需要去尋找解決辦法,或許最先想到的是更換新的自動化生成軟件,但是還是難保人爲合併出錯、軟件識別出錯等問題。 在工作時間中,我想到了可以做文字對比的方案,每天的幾版報紙也不多,即使每篇文章都做一次對比
相關文章
相關標籤/搜索