最近項目有個需求,將客戶提供的URI連接轉化爲PDF文件,本來打算使用itext轉換的,發現使用itext轉化後的PDF格式和html差別過大。後來經同事介紹可使用wkhtmltopdf對html或URI連接轉化爲PDF,通過測試確實很強大,也比較簡單,可是要安裝wkhtmltopdf插件。javascript
使用步驟:html
一、下載wkhtmltopdf插件java
二、安裝wkhtmltopdf並配置環境變量服務器
三、測試wkhtmltopdfcookie
wkhtmltopdf html地址或URI連接 PDF文件保存路徑網絡
生成的PDF文件以下:app
四、java調用wkhtmltopdfless
package com.kurumi.medical.util; import java.io.BufferedReader; import java.io.File; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; public class Html2PDF { /** * wkhtmltopdf命令地址 */ private static final String TOPDFTOOL = "C://Program Files//wkhtmltopdf//bin//wkhtmltopdf.exe"; /** * html轉pdf * * @param srcPath * html路徑,能夠是硬盤上的路徑,也能夠是網絡路徑 * @param destPath * pdf保存路徑 * @return 轉換成功返回true */ public static boolean convert(String srcPath, String destPath) { File file = new File(destPath); File parent = file.getParentFile(); // 若是pdf保存路徑不存在,則建立路徑 if (!parent.exists()) { parent.mkdirs(); } StringBuilder cmd = new StringBuilder(); cmd.append(TOPDFTOOL); cmd.append(" "); cmd.append(srcPath); cmd.append(" "); cmd.append(" --page-size A4");// 設置紙張大小 cmd.append(destPath); boolean result = true; try { Process proc = Runtime.getRuntime().exec(cmd.toString()); HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream()); HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream()); error.start(); output.start(); proc.waitFor(); System.out.println("HTML2PDF成功"); } catch (Exception e) { System.out.println(("HTML2PDF失敗")); e.printStackTrace(); result = false; } return result; } public static class HtmlToPdfInterceptor extends Thread { private InputStream is; public HtmlToPdfInterceptor(InputStream is) { this.is = is; } public void run() { try { InputStreamReader isr = new InputStreamReader(is, "utf-8"); BufferedReader br = new BufferedReader(isr); br.readLine(); } catch (IOException e) { e.printStackTrace(); } } } public static void main(String[] args) { String htmlPath = "http://www.baidu.com/"; String pdfPath = "D://testpdf2.pdf"; Html2PDF.convert(htmlPath, pdfPath); } }
五、經常使用參數設置post
常規選項 –allow 容許加載從指定的文件夾中的文件或文件(可重複) –book* 設置一會打印一本書的時候,一般設置的選項 –collate 打印多份副本時整理 –cookie 設置一個額外的cookie(可重複) –cookie-jar 讀取和寫入的Cookie,並在提供的cookie jar文件 –copies 複印打印成pdf文件數(默認爲1) –cover* 使用HTML文件做爲封面。它會帶頁眉和頁腳的TOC以前插入 –custom-header 設置一個附加的HTTP頭(可重複) –debug-javascript 顯示的javascript調試輸出 –default-header* 添加一個缺省的頭部,與頁面的左邊的名稱,頁面數到右邊,例如: –header-left ‘[webpage]’ –header-right ‘[page]/[toPage]’ –header-line –disable-external-links* 禁止生成連接到遠程網頁 –disable-internal-links* 禁止使用本地連接 –disable-javascript 禁止讓網頁執行JavaScript –disable-pdf-compression* 禁止在PDF對象使用無損壓縮 –disable-smart-shrinking* 禁止使用WebKit的智能戰略收縮,使像素/ DPI比沒有不變 –disallow-local-file-access 禁止容許轉換的本地文件讀取其餘本地文件,除非explecitily容許用 –allow –dpi 顯式更改DPI(這對基於X11的系統沒有任何影響) –enable-plugins 啓用已安裝的插件(如Flash –encoding 設置默認的文字編碼 –extended-help 顯示更普遍的幫助,詳細介紹了不常見的命令開關 –forms* 打開HTML表單字段轉換爲PDF表單域 –grayscale PDF格式將在灰階產生 –help Display help –htmldoc 輸出程序HTML幫助 –ignore-load-errors 忽略claimes加載過程當中已經遇到了一個錯誤頁面 –lowquality 產生低品質的PDF/ PS。有用縮小結果文檔的空間 –manpage 輸出程序手冊頁 –margin-bottom 設置頁面下邊距 (default 10mm) –margin-left 將左邊頁邊距 (default 10mm) –margin-right 設置頁面右邊距 (default 10mm) –margin-top 設置頁面上邊距 (default 10mm) –minimum-font-size 最小字體大小 (default 5) –no-background 不打印背景 –orientation 設置方向爲橫向或縱向 –page-height 頁面高度 (default unit millimeter) –page-offset* 設置起始頁碼 (default 1) –page-size 設置紙張大小: A4, Letter, etc. –page-width 頁面寬度 (default unit millimeter) –password HTTP驗證密碼 –post Add an additional post field (repeatable) –post-file Post an aditional file (repeatable) –print-media-type* 使用的打印介質類型,而不是屏幕 –proxy 使用代理 –quiet Be less verbose –read-args-from-stdin 讀取標準輸入的命令行參數 –readme 輸出程序自述 –redirect-delay 等待幾毫秒爲JS-重定向(default 200) –replace* 替換名稱,值的頁眉和頁腳(可重複) –stop-slow-scripts 中止運行緩慢的JavaScripts –title 生成的PDF文件的標題(第一個文檔的標題使用,若是沒有指定) –toc* 插入的內容的表中的文件的開頭 –use-xserver* 使用X服務器(一些插件和其餘的東西沒有X11可能沒法正常工做) –user-style-sheet 指定用戶的樣式表,加載在每一頁中 –username HTTP認證的用戶名 –version 輸出版本信息退出 –zoom 使用這個縮放因子 (default 1) 頁眉和頁腳選項 –header-center* (設置在中心位置的頁眉內容) –header-font-name* (default Arial) (設置頁眉的字體名稱) –header-font-size* (設置頁眉的字體大小) –header-html* (添加一個HTML頁眉,後面是網址) –header-left* (左對齊的頁眉文本) –header-line* (顯示一條線在頁眉下) –header-right* (右對齊頁眉文本) –header-spacing* (設置頁眉和內容的距離,默認0) –footer-center* (設置在中心位置的頁腳內容) –footer-font-name* (設置頁腳的字體名稱) –footer-font-size* (設置頁腳的字體大小default 11) –footer-html* (添加一個HTML頁腳,後面是網址) –footer-left* (左對齊的頁腳文本) –footer-line* 顯示一條線在頁腳內容上) –footer-right* (右對齊頁腳文本) –footer-spacing* (設置頁腳和內容的距離) ./wkhtmltopdf –footer-right ‘[page]/[topage]’ http://www.baidu.com baidu.pdf ./wkhtmltopdf –header-center ‘報表’ –header-line –margin-top 2cm –header-line http://192.168.212.139/oma/ oma.pdf 表內容選項中 –toc-depth* Set the depth of the toc (default 3) –toc-disable-back-links* Do not link from section header to toc –toc-disable-links* Do not link from toc to sections –toc-font-name* Set the font used for the toc (default Arial) –toc-header-font-name* The font of the toc header (if unset use –toc-font-name) –toc-header-font-size* The font size of the toc header (default 15) –toc-header-text* The header text of the toc (default Table Of Contents) –toc-l1-font-size* Set the font size on level 1 of the toc (default 12) –toc-l1-indentation* Set indentation on level 1 of the toc (default 0) –toc-l2-font-size* Set the font size on level 2 of the toc (default 10) –toc-l2-indentation* Set indentation on level 2 of the toc (default 20) –toc-l3-font-size* Set the font size on level 3 of the toc (default 8) –toc-l3-indentation* Set indentation on level 3 of the toc (default 40) –toc-l4-font-size* Set the font size on level 4 of the toc (default 6) –toc-l4-indentation* Set indentation on level 4 of the toc (default 60) –toc-l5-font-size* Set the font size on level 5 of the toc (default 4) –toc-l5-indentation* Set indentation on level 5 of the toc (default 80) –toc-l6-font-size* Set the font size on level 6 of the toc (default 2) –toc-l6-indentation* Set indentation on level 6 of the toc (default 100) –toc-l7-font-size* Set the font size on level 7 of the toc (default 0) –toc-l7-indentation* Set indentation on level 7 of the toc (default 120) –toc-no-dots* Do not use dots, in the toc 輪廓選項 –dump-outline 轉儲目錄到一個文件 –outline 顯示目錄(文章中h1,h2來定) –outline-depth 設置目錄的深度(默認爲4) 頁腳和頁眉 * [page] 由當前正在打印的頁的數目代替 * [frompage] 由要打印的第一頁的數量取代 * [topage] 由最後一頁要打印的數量取代 * [webpage] 經過正在打印的頁面的URL替換 * [section] 由當前節的名稱替換 * [subsection] 由當前小節的名稱替換 * [date] 由當前日期系統的本地格式取代 * [time] 由當前時間,系統的本地格式取代