PDF是將文檔發送給第三方的最經常使用格式之一。形成這種流行的緣由是PDF跨多個平臺的兼容性,而不考慮任何硬件/軟件要求。可是,在某些狀況下,可能但願將PDF文檔轉換爲可編輯的文檔格式。編程
在這種狀況下, PDF到Word DOC或DOCX多是優先級轉換選項。爲了使轉換過程自動化,本文將展現如何在Java中以編程方式將PDF轉換爲Word。若是你尚未升級Aspose.PDF最新版測試,能夠點擊這裏下載。測試
在本文中,咱們將使用Aspose.PDF在Java中執行如下PDF到DOC/DOCX的轉換:spa
在應用程序中引用了Java的Aspose.PDF以後,能夠經過幾行代碼將任何PDF文檔轉換爲DOC格式。如下是執行此轉換所需的步驟。3d
如下代碼示例顯示瞭如何在Java中將PDF轉換爲DOC。orm
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOC file doc.save("output.doc", SaveFormat.Doc);
輸入的PDF文件blog
轉換後的Excel文檔文檔
DOCX是Word文檔的一種衆所周知的格式,與DOC格式相反,DOCX的結構基於二進制文件和XML文件。若是要將PDF轉換爲DOCX格式,可使用Document.save()方法中的SaveFormat.DocX參數告訴API這樣作。get
如下代碼示例顯示瞭如何在Java中將PDF轉換爲DOCX。input
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOCX file doc.save("output.docx", SaveFormat.DocX);
Aspose.PDF for Java還提供了一些其餘選項,能夠在PDF到Word的轉換中使用這些選項,例如輸出格式,圖像分辨率,文本行之間的距離等。DocSaveOptions類用於此目的,如下是您可使用的選項列表:it
下面的代碼示例演示如何使用Java將PDF中的DocSaveOptions類轉換爲DOCX。
// Load source PDF file Document doc = new Document("input.pdf"); // Instantiate DocSaveOptions instance DocSaveOptions saveOptions = new DocSaveOptions(); // Set output format saveOptions.setFormat(DocSaveOptions.DocFormat.DocX); // Set the recognition mode as Flow saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); // Set the horizontal proximity as 2.5 saveOptions.setRelativeHorizontalProximity(2.5f); // Enable bullets recognition during conversion process saveOptions.setRecognizeBullets(true); // Save resultant DOCX file doc.save("resultant.docx", saveOptions);