nodejs將PDF文件轉換成txt文本,並利用python處理轉換後的文本文件

目前公司Web服務端的開發是用Nodejs,所以開發功能的話首先使用Nodejs,這也是爲什麼不直接用python轉換的原因。 由於node對文本的處理(提取所需信息)的能力不強,類似於npm上的包:‘linebyline’、'lineReader',處理能力都不強,所以使用python來處理。   目的:提取PDF中帶有‘檢查'字樣的文本(行) 思路: 1、Nodejs 找到PDF轉換text的
相關文章
相關標籤/搜索