如何在 Java 中將 DOCX 轉換爲 HTML

雖然 Word DOCX 格式是建立文本文檔的首選,但當咱們進入基於 Web 的領域時,它多是不夠的。git

正如咱們在以前的文章中所討論的,雖然 Word DOCX 格式是建立文本文檔的首選,但當咱們進入基於 Web 的領域時,它多是不夠的。在考慮格式化在線文檔時,超文本標記語言 (HTML) 成爲應用程序和網站的明顯贏家之一。這種動態語言利用設置提示或元素來構建能夠傳輸到瀏覽器並做爲可讀網頁呈現給最終用戶的文檔。HTML 的結構甚至容許集成圖像、交互式表單和其餘更難用簡單的 Word 文檔建立的對象。github

Word DOCX 格式實際上基於不一樣的標記語言 XML(可擴展標記語言)。微軟在 2000 年代中期將其最受歡迎的程序——Word、Excel 和 PowerPoint——轉變爲開放標準、基於 XML 的格式。此舉旨在改進文件大小、圖像壓縮和安全性,並保持領先於競爭對手的優點。雖然因爲與其餘平臺兼容,一些用戶仍然更喜歡舊的 DOC 版本,但 DOCX 格式一般是當前文字處理項目的更好選擇。api

因爲每種格式的細微差異,若是您嘗試從 Word 文檔中起草 HTML 代碼,則與文件格式相關的附加格式和樣式可能會阻礙其使用。除此以外,DOCX 設計的複雜性使得解析信息成爲一項使人不快的任務。在本教程中,咱們將演示如何使用 Java 中的 API 將任何 DOCX 文件自動轉換爲 HTML,從而即時改進兼容性和產品質量。瀏覽器

首先,咱們將經過在 pom.xml 中添加對存儲庫的引用來安裝 Maven:安全

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>

而後,咱們能夠在 pom.xml 中添加對依賴項的引用:函數

<dependencies>
<dependency>
    <groupId>com.github.Cloudmersive</groupId>
    <artifactId>Cloudmersive.APIClient.Java</artifactId>
    <version>v3.90</version>
</dependency>
</dependencies>

安裝完成後,咱們準備將導入添加到咱們的控制器頂部並使用如下代碼調用轉換函數:學習

// Import classes:
//import com.cloudmersive.client.invoker.ApiClient;
//import com.cloudmersive.client.invoker.ApiException;
//import com.cloudmersive.client.invoker.Configuration;
//import com.cloudmersive.client.invoker.auth.*;
//import com.cloudmersive.client.ConvertDocumentApi;

ApiClient defaultClient = Configuration.getDefaultApiClient();

// Configure API key authorization: Apikey
ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");
Apikey.setApiKey("YOUR API KEY");
// Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null)
//Apikey.setApiKeyPrefix("Token");

ConvertDocumentApi apiInstance = new ConvertDocumentApi();
File inputFile = new File("/path/to/inputfile"); // File | Input file to perform the operation on.
try {
    byte[] result = apiInstance.convertDocumentDocxToHtml(inputFile);
    System.out.println(result);
} catch (ApiException e) {
    System.err.println("Exception when calling ConvertDocumentApi#convertDocumentDocxToHtml");
    e.printStackTrace();
}

爲確保流程正確運行,您須要輸入幾個參數:網站

文件 - 要對其執行操做的 DOCX 文件。
API 密鑰 – 您的我的 API 密鑰。若是您須要獲取API key,您能夠訪問Cloudmersive網站註冊一個免費帳號;這在咱們的 API 庫中每個月提供 800 次調用。
該過程將返回一個 HTML 文檔,該文檔可輕鬆用於適用的網站和/或應用程序。url

參考:《2020最新Java基礎精講視頻教程和學習路線!》設計

相關文章
相關標籤/搜索