python數據分析:PDFminer3k解析pdf爲文字遇到:WARING:root:GBK-EUC-H

而後運行本身真正須要的PDF時,報錯:git 剛開始我天真的覺得是pdf加密了,後來查了下發現pdfminer3k自帶能解密一些簡單的加密方法,且遇到加密報錯不是這樣的。github 而後從新仔細研究報錯,以爲應該是pdf的字體的問題,pdfminer3k不能解析特殊字體,須要下載相應的字體包來解決。字體 字體包下載網站:https://github.com/euske/pdfminer/pull
相關文章
相關標籤/搜索