HTML Filter 是由北京紅櫻楓軟件有限公司依據HTML Ver 4.01/CSS式樣,研製和開發的MS Office系列文檔到HTML轉換的通用程序庫。便於用戶實現對多種文檔的統一管理,編輯,檢索和瀏覽,可以完美的實現文檔附件在線預覽功能。本產品採用了先進的多語言、多平臺、多線程的設計理念,支持多國語言,多種操做系統,提供了多種形式的API功能接口,便於用戶使用。用戶能夠方便的將本產品組裝到本身的應用程序中。經過調用本產品的提供的API功能接口,實現MS Office系列文檔到HTML的快速轉換。
本產品在國內外獲得了普遍的應用,在國內有騰訊、搜狐等多家知名企業使用本產品。對多種文檔進行統一管理,編輯,檢索和瀏覽。用戶可使用本產品,十分便利的將文檔附件Word,Excel,PPT文檔轉換爲HTML,經過瀏覽器瀏覽HTML的內容。本產品在性能和質量上都獲得了用戶普遍的好評。
例如郵件附件在線預覽,就是當收到郵件帶有文檔附件時,尤爲是超大附件,能夠不用下載郵件中的附件,經過web頁面,以在線的方式讀取其中的內容。此功能方便用戶直接查看附件,節省下載的時間,同時也在不少時候極大的方便了沒有安裝相應軟件的用戶,對於異地登陸郵箱用戶,更是一項不錯的服務。
1、技術優點:css
1.能夠支持多種操做系統環境、支持服務器併發操做
支持各類操做系統,如:Linux32bit、Linux64bit 、Windows的32位和64位各類版本以及Sun SPARC版Solaris(32bit/64bit)、x86版Solaris10(64bit)、IBM AIX 5L、Macintosh等,並支持單線程或多線程操做,實現了多人共用機制。
2. 無與倫比的運行速度
程序所有用C/C++語言開發,執行速度無與倫比,即便是單線程運行,平均每秒鐘處理9個文件,當50個線程時,每秒鐘16個文件,隨着線程數的增長以及機器性能的提升。是目前世界上處理文檔效率最高的軟件。
3. 對文件的操做不須要安裝其餘任何第三方軟件
文件操做在數據轉換過程當中徹底獨立對文件格式進行分析轉換,不須要安裝生成文件的原軟件。特別是不依賴於原軟件的各類文檔的Image化、PDF化技術,在網絡服務器中的應用很是普遍。這是一項世界上比較流行、且需求量很大的技術。
2、產品功能介紹html
1. 文件格式自動識別功能
本產品經過解析文件內部的信息,自動識別生成文件的應用程序名和其版本號,不依賴於文件的擴展名,可以正確識別文件格式和相應的版本信息。能夠識別的文件格式以下所示 :
・ Microsoft Word 2007/2010
・ Microsoft Word 2003/XP/2001(mac)/2000/98(mac)/97/Ver.7(95)/Ver.6
・ Microsoft Excel 2007/2010
・ Microsoft Excel 2003/XP/2001(mac)/2000/98(mac)/97/7(95)/Ver.5/Ver.4
・ Microsoft PowerPoint 2007/2010
・ Microsoft PowerPoint 2003/XP/2001(mac)/2000/97/95
・ Microsoft RTF
・ PDF 1.0/1.1/1.2/1.3/1.4
・ 一太郎11/10/9/Lite/8/7/Ver.6.3/Ver.6/Dash2/Ver.5/Ver.4.3/Ver.4
・ OASYS V8/V7/V6/V5 分離型、結合型、複合型文件
・ OASYS Ver.4.1/Ver.4.0Ver.3.0a/Ver.3.0 分離型、結合型文件
・ OASYS V5/V6的on line形式
・ Lotus 1-2-3 R5J/97/98/2000/MillenniumEdition
・ HTML
・ AutoCAD GX-III/GX-5/R12/R13/R14/2000のDXF形式
・ AutoCAD GX-III/GX-5/R12/R13/R14/2000のDWG形式
・ IGES
・ Adobe PageMaker 6.0/6.5
・ ClarisWorks 4.0(WP、SS、DB)
・ AppleWorks 6(WP、SS、DB、DR、PR、PT)
・ XML
・ WordPerfect 7/8/9
・ Mac Write Ⅱ
・ Microsoft Works 2000(WP、SS、DB)
・ Corel Presentations 9
・ QuarkXpress 3.3/4
2. HTML轉換功能
依據HTMLVer4.01 CSS Level2(Cascading Style Sheets)的式樣說明,將指定的對象文件Microsoft Word,PowerPoint,Excel轉換爲HTML文件。
3. 支持的對象文件格式和版本
指定如下的文件格式,能夠轉換爲HTML文件。
・ Microsoft Word 2007/2010/2013
・ Microsoft Word 2003/XP/2001(mac)/2000/98(mac)/97/Ver.7(95)/Ver.6
・ Microsoft Excel 2007/2010/2013
・ Microsoft Excel 2003/XP/2001(mac)/2000/98(mac)/97/7(95)/Ver.5/Ver.4
・ Microsoft PowerPoint 2007/2010/2013
・ Microsoft PowerPoint 2003/XP/2001(mac)/2000/97/95
4. 支持的瀏覽器種類
使用如下的瀏覽器,能夠正常瀏覽轉換的HTML文件。
・ Internet Explorer 9.0/10/11(Windows,Macintosh 共同)
・ Netscape 6.2以上(Windows,Macintosh 共通)
5. 支持的語言種類
・ 中文簡體
・ 中文繁體
・ 英語
・ 日本語
・ 韓國語
6. 支持轉換到HTML文件的字符集合的種類
轉換HTML文件時,能夠指定如下的字符集合做爲HTML文件的字符集。
・ GBK
・ GB18030
・ Big5
・ Shift_JIS
・ EUC-JP
・ EUC-JP-FIX
・ ISO-2022-JP
・ KS X 1001
・ ISO-8859-1
・ ISO-10646-UCS-2
・ ISO-10646-UCS-4
・ UTF-16
・ UTF-8
3、HTML文件轉換規格的說明web
1. 文件名的規定
轉換的HTML文件名默認使用原文件名。當原文件內有圖像數據或指定CSS文件做爲外部文件輸出時,在HTML文件所在的目錄下,生成文件夾,在該文件夾中保存圖像文件、CSS文件。
2. 圖像文件名的規定
image+編號.擴展名(擴展名爲原數據中的圖像的擴展名)
3. CSS文件明的規定
htmlFilter.css 爲固定形式。
4. 關於圖像轉換
在HTML文件中可使用的圖像文件格式爲GIF,JPEG和PNG。在Word,Excel,PowerPoint中保存了GIF,JPEG和PNG之外的圖像,轉換的HTML文件,可能沒法顯示。
本產品將Word,Excel,PowerPoint中的WMF和EMF形式保存的圖像文件轉換爲Windows版的PNG形式。在Linux版和Solaris版中,沒法進行圖像文件的轉換。所以,轉換的HTML文件中的WMF、EMF圖像文件沒法顯示。瀏覽器