PDF開發工具Aspose.PDF功能推薦——在.NET中將PDF轉換爲HTML

PDF是當今最流行的文檔格式之一,各類應用程序將其用做最終輸出。因爲支持多種數據類型和可移植性,所以它是建立和共享內容的首選格式。做爲對開發文檔管理應用程序感興趣的.NET應用程序開發人員,可能但願嵌入處理功能,以讀取PDF文檔並將其轉換爲其餘文件格式,例如HTML。html

下面,來探索並演示一下Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件並將其轉換爲HTML。編碼

 

將HTML轉換到PDF

只需使用幾行代碼和資源加載回調就能夠以很是基本的方式將HTML轉換爲PDF,如下是使您達到目的的代碼段:spa

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

HtmlLoadOptions options = new HtmlLoadOptions();
options.CustomLoaderOfExternalResources = new LoadOptions.ResourceLoadingStrategy(SamePictureLoader);

Document pdfDocument = new Document(dataDir + "HTMLToPDF.html", options);
pdfDocument.Save("HTMLToPDF_out.pdf");

將PDF轉換爲多頁HTML

可使用如下示例代碼在將PDF轉換爲HTML的過程當中,將上述步驟中的HTML分爲多個頁面。htm

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Open the source PDF document
Document pdfDocument = new Document(dataDir + "PDFToHTML.pdf");

// Instantiate HTML SaveOptions object
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();

// Specify to split the output into multiple pages
htmlOptions.SplitIntoPages = true;

// Save the document
pdfDocument.Save(@"MultiPageHTML_out.html", htmlOptions);

將SplitIntoPages標誌設置爲true能夠爲您完成全部工做,而且輸出HTML由多個頁面而不是單個頁面組成。ip

將圖像保存到特定文件夾

PDF文檔除了文本詳細信息外還能夠包含圖像。HTML能夠包含HTML內基於64位編碼的圖像,也能夠引用這些圖像所在的文件夾中的圖像。Aspose.PDF API具備豐富的功能,能夠將圖像保存到光盤上用戶指定的文件夾中。如下代碼示例顯示了在將PDF轉換爲HTML的過程當中如何將圖像保存到特定文件夾。ci

// Create HtmlSaveOption with tested feature
HtmlSaveOptions newOptions = new HtmlSaveOptions();

// Specify the separate folder to save images
newOptions.SpecialFolderForAllImages = dataDir;

 若是你對Aspose的產品感興趣或有任何技術難題均可以加入Aspose交流(642018183)資源

相關文章
相關標籤/搜索