java讀取pdf中數據,包含表格和圖片

任務是提取pdf文件中的數據,並將其轉化到csv格式的文件中。java 首先用到的工具爲開源jar包:pdfbox,因爲pdf中沒有表結構,且要提取的pdf文件格式固定,pdfbox提供extractbyarea方法,因此經過座標能夠提取表格中每一列的數據,好像方法挺笨的,可是沒找到其餘跟好的方法。工具 關於java操做pdf,在網上看到好多人說itext比pdfbox方便,功能強大,可是itex
相關文章
相關標籤/搜索