python數據分析:PDFminer3k解析pdf爲文字遇到:WARING:root:GBK-EUC-H

然後運行自己真正需要的PDF時,報錯: 剛開始我天真的以爲是pdf加密了,後來查了下發現pdfminer3k自帶能解密一些簡單的加密方法,且遇到加密報錯不是這樣的。 然後重新仔細研究報錯,覺得應該是pdf的字體的問題,pdfminer3k不能解析特殊字體,需要下載相應的字體包來解決。 字體包下載網站:https://github.com/euske/pdfminer/pull/71/commits
相關文章
相關標籤/搜索