Java 生成 PDF 文檔

最近項目須要實現PDF下載的功能,因爲沒有這方面的經驗,從網上花了很長時間才找到相關的資料。整理以後,發現有以下幾個框架能夠實現這個功能。java

1. 開源框架支持

  • iText,生成PDF文檔,還支持將XML、Html文件轉化爲PDF文件;
  • Apache PDFBox,生成、合併PDF文檔;
  • docx4j,生成docx、pptx、xlsx文檔,支持轉換爲PDF格式。

比較:git

  • iText開源協議爲AGPL,而其餘兩個框架協議均爲Apache License v2.0。
  • 使用PDFBox生成PDF就像畫圖似的,文字和圖像根據頁面座標畫上去的,須要根據字數手動換行。
  • docx4j用來生成docx文檔,提供了將WORD文檔轉換爲PDF文檔的功能,並不能直接生成PDF文檔。

2. 實現方案

格式複雜 格式簡單
數據量大 docx4j+freemarker docx4j或PDFBox
數據量小 docx4j PDFBox

2.1 純數據生成PDF

1.docx4j,適用於生成格式簡單或格式複雜且數據量小的PDF文檔; 2.Apache PDFBox,適用於生成格式簡單且數據量小的PDF文檔。程序員

1.docx4j docx4j是一個開源Java庫,用於建立和操做Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件。它相似於Microsoft的OpenXML SDK,但適用於Java。docx4j使用JAXB來建立內存中的對象表示,程序員須要花時間瞭解JAXB和Open XML文件結構 。github

// word對象
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
// 文檔主體
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// 換行符
Br br = objectFactory.createBr();
// 段落
P p = objectFactory.createP();
// 段落設置
PPr ppr = objectFactory.createPPr();
// 文字位置
Jc jc = new Jc();
jc.setVal(je);
ppr.setJc(jc);
// 行設置
RPr rpr = objectFactory.createRPr();
// 字體設置
RFonts rFonts = objectFactory.createRFonts();
rFonts.setAscii("Times New Roman");
rFonts.setEastAsia("宋體");
rpr.setRFonts(rFonts);
// 行
R r = objectFactory.createR();
// 文本
Text text = objectFactory.createText();
text.setValue("這是一段普通文本");
r.setRPr(rpr);
r.getContent().add(br);
r.getContent().add(text);
p.getContent().add(r);
p.setPPr(ppr);
// 添加到正文中
mainDocumentPart.addObject(p);
// 導出
//..
複製代碼

2.Apache PDFBox Apache PDFBox是處理PDF文檔的一個開源的Java工具。該項目容許建立新的PDF文檔,處理現有文檔以及從文檔中提取內容的功能。Apache PDFBox還包括幾個命令行實用程序。app

String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf";
// 定義文檔對象
PDDocument document = new PDDocument();
// 定義一頁,大小A4
PDPage page = new PDPage(PDRectangle.A4);
document.addPage(page);
// 獲取字體
PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf"));
// 定義頁面內容流
PDPageContentStream stream = new PDPageContentStream(document, page);
// 設置字體及文字大小
stream.setFont(font, 12);
// 設置畫筆顏色
stream.setNonStrokingColor(Color.BLACK);
// 添加矩形
stream.addRect(29, 797, 100, 14);
// 填充矩形
stream.fill();
stream.setNonStrokingColor(Color.BLACK);
// 文本填充開始
stream.beginText();
// 設置行距
stream.setLeading(18f);
// 設置文字位置
stream.newLineAtOffset(30, 800);
// 填充文字
stream.showText("呵呵");
// 換行
stream.newLine();
stream.showText("哈哈");
stream.newLine();
stream.showText("嘻嘻");
// 文本填充結束
stream.endText();
// 關閉流
stream.close();
// 保存
document.save(formTemplate);
// 釋放資源
document.close();
複製代碼

2.2 模版+數據生成PDF

FreeMarker+docx4j,適用於生成格式複雜且數據量大的PDF文檔框架

Apache FreeMarker是一個模板引擎,用於根據模板和更改數據生成文本輸出(HTML網頁,電子郵件,配置文件,源代碼等)。模板是用FreeMarker模板語言(FTL)編寫的,是一種簡單的專用語言。ide

Office2003以上,Word是能夠以XML文本格式存儲的。先將要生成的PDF轉換爲Word文檔 ,再將其保存爲XML文本,經過模版引擎將數據填充到XML文本中,最後再反向轉換爲PDF文檔。簡單來講就是PDF->Word->XML->Word->PDF的流程。工具

步驟 描述 工具
1 word -> xml 手動
2 xml -> ftl 手動,參考《XML格式Word文檔經常使用標籤介紹》
3 ftl + obj = xml freemarker
4 xml -> pdf docx4j
步驟
  • 1 把pdf文檔對應的word(docx)製做出來
    簡歷.png
  • 2 把word文檔另存爲xml文件
    另存爲xml
  • 3 將xml文件製做爲freemarker模版(ftl)文件
    製做模版文件
  • 4 將數據和ftl文件組裝爲xml文本
Map<String, Object> map = new HashMap<>();
map.put("name", "小明");
map.put("address", "北京市朝陽區");
map.put("email", "xiaoming@abc.com");
StringWriter stringWriter = new StringWriter();
BufferedWriter writer = new BufferedWriter(stringWriter);
template.process(map, writer);
String xmlStr = stringWriter.toString();
複製代碼
  • 5 使用docx4j將xml文本加載爲word文檔對象
ByteArrayInputStream in = new ByteArrayInputStream(xmlStr.getBytes());
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(in);
複製代碼
  • 6 使用docx4j將word文檔轉存爲pdf文檔
String outputfilepath = "/Users/xiaoming/簡歷.pdf";
FileOutputStream os = new FileOutputStream(new File(outputFilePath));
FOSettings foSettings = Docx4J.createFOSettings();
foSettings.setWmlPackage(wordMLPackage);
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);
// Docx4J.toPDF(wordMLPackage, new FileOutputStream(new File(outputfilepath)));
複製代碼

2.3 Word轉PDF

docx4j字體

WordprocessingMLPackage mlPackage = WordprocessingMLPackage.load(new File("abc.docx"));
Mapper fontMapper = new IdentityPlusMapper();  
// fontMapper.put("華文行楷", PhysicalFonts.get("STXingkai")); 
mlPackage.setFontMapper(fontMapper);  
OutputStream os = new java.io.FileOutputStream("abc.pdf");    
FOSettings foSettings = Docx4J.createFOSettings();  
foSettings.setWmlPackage(mlPackage);  
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);  
複製代碼

2.4 合併多個PDF

Apache PDFBox,將多個PDF文檔合併spa

String folderName = "/Users/xiaoming/pdfs";
String destPath = "/Users/xiaoming/all.pdf";
PDFMergerUtility mergePdf = new PDFMergerUtility();
String[] filesInFolder = getFiles(folderName);
Arrays.sort(filesInFolder, new Comparator<String>() {
      @Override
      public int compare(String o1, String o2) {
          return o1.compareTo(o2);
      }
});
for (int i = 0; i < filesInFolder.length; i++) {
     mergePdf.addSource(folderName + File.separator + filesInFolder[i]);
}
mergePdf.setDestinationFileName(destPath);
mergePdf.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
複製代碼

示例代碼

github.com/brandonbai/…

相關文章
相關標籤/搜索