python3 多進程 處理PDF爲txt文件

需求是將pdf的文本抽取出來,而後將文本存入到數據庫中。以前嘗試直接讀取在線的pdf文件,發現用第三方讀取在線的文件時有些問題,因此考慮先將pdf下載到本地。而後多進程抽取本地的pdf文件爲txt文件。再去讀取txt裏的文件內容存入數據庫html 代碼以下:python # -*- coding: utf-8 -*- #將pdf下載到本地再讀取pdf文件內容到txt #多進程處理版本 impor
相關文章
相關標籤/搜索