手把手 | 20行Python代碼教你批量將PDF轉爲Word

在平常工做或學習中,常常會遇到這樣的無奈:python

「小任,你把這個PDF中的文件碼出來發我」學習

艹,倒黴,2M的PDF12點也完不了啊!3d

80793d3a7d51abae3ad586fc1d85b2faed8a4a1a

不少時候在學習時發現許多文檔都是PDF格式,PDF格式卻不利於學習使用,所以須要將PDF轉換爲Word文件,但或許你從網上下載了不少軟件,但只能轉換前五頁(如WPS等),要不就是須要收費,那有沒有免費的轉換軟件呢?對象

so,咱們給各位帶來了一個免費簡單快速的方法,手把手教你用Python批量處理PDF格式文件,獲取本身想要的內容,存爲word形式。blog

在實現PDF轉Word功能以前,咱們須要一個python的編寫和運行環境,同時安裝好相關的依賴包。 對於python環境,咱們推薦使用PyCharm。 在本地電腦環境,anaconda提供了很是便利的安裝和部署。ip

PDF轉Word功能所需的依賴包以下:資源

  • PDFParser(文檔分析器)
  • PDFDocument(文檔對象)
  • PDFResourceManager(資源管理器)
  • PDFPageInterpreter(解釋器)
  • PDFPageAggregator(聚合器)
  • LAParams(參數分析器)

前期準備工做文檔

說明:本文是在Windows7下使用python最新的3.6版本部署

1.安裝pdfminer3k模塊pip

安裝anaconda後,直接能夠經過pip安裝

相關文章
相關標籤/搜索