用pdftohtml將PDF轉成HTML

pdftohtml一樣是超強命令行工具集poppler的一個子集,和pdfimages等優秀的子集同樣。用好了是很是便利的。html 須要理解的是,pdftohtml對掃描版PDF是沒什麼用對。它的主要功能是把pdf中元素所有提取出來,而後按照佈局生成HTML。可是掃描版的至關因而一張圖片,沒有任何元素信息。工具 Mac上,直接homebrew:佈局 $ brew install poppler
相關文章
相關標籤/搜索