PDF是當今最流行的文檔格式之一,各類應用程序將其用做最終輸出。因爲支持多種數據類型和可移植性,所以它是建立和共享內容的首選格式。做爲對開發文檔管理應用程序感興趣的.NET應用程序開發人員,可能但願嵌入處理功能,以讀取PDF文檔並將其轉換爲其餘文件格式,例如HTML。html
下面,來探索並演示一下Aspose.PDF for .NET API的強大轉換功能,以使用多種選項讀取PDF文件並將其轉換爲HTML。編碼
只需使用幾行代碼和資源加載回調就能夠以很是基本的方式將HTML轉換爲PDF,如下是使您達到目的的代碼段:spa
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); HtmlLoadOptions options = new HtmlLoadOptions(); options.CustomLoaderOfExternalResources = new LoadOptions.ResourceLoadingStrategy(SamePictureLoader); Document pdfDocument = new Document(dataDir + "HTMLToPDF.html", options); pdfDocument.Save("HTMLToPDF_out.pdf");
可使用如下示例代碼在將PDF轉換爲HTML的過程當中,將上述步驟中的HTML分爲多個頁面。htm
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); // Open the source PDF document Document pdfDocument = new Document(dataDir + "PDFToHTML.pdf"); // Instantiate HTML SaveOptions object HtmlSaveOptions htmlOptions = new HtmlSaveOptions(); // Specify to split the output into multiple pages htmlOptions.SplitIntoPages = true; // Save the document pdfDocument.Save(@"MultiPageHTML_out.html", htmlOptions);
將SplitIntoPages標誌設置爲true能夠爲您完成全部工做,而且輸出HTML由多個頁面而不是單個頁面組成。ip
PDF文檔除了文本詳細信息外還能夠包含圖像。HTML能夠包含HTML內基於64位編碼的圖像,也能夠引用這些圖像所在的文件夾中的圖像。Aspose.PDF API具備豐富的功能,能夠將圖像保存到光盤上用戶指定的文件夾中。如下代碼示例顯示了在將PDF轉換爲HTML的過程當中如何將圖像保存到特定文件夾。ci
// Create HtmlSaveOption with tested feature HtmlSaveOptions newOptions = new HtmlSaveOptions(); // Specify the separate folder to save images newOptions.SpecialFolderForAllImages = dataDir;
若是你對Aspose的產品感興趣或有任何技術難題均可以加入Aspose交流羣(642018183)資源