在開發Web辦公系統或文檔系統時,PageOffice組件是衆所周知的在線處理微軟word/ppt/excel文檔的強大工具,它對WORD文檔的各類處理在API層面進行了封裝,屏蔽了Office VBA接口的複雜性,而又不失VBA的強大功能,在此要分享的正是PageOffice封裝的一個很強大的功能:獲取word文檔的條目化內容。在一個包含了文檔處理功能的辦公系統裏,用戶出於各類緣由,但願能經過程序自動分析word文檔中每一個章節的內容也是一種合理的需求,而PageOffice爲實現此功能提供的接口也很是簡單,廢話少說,直接看代碼:java
PageOffice具體的集成過程在此略過。。。(詳細看PageOffice for java 開發包中的安裝說明)web
1. 調用PageOffice在線打開一個包含了章節層次的word文檔,好比:test.docjsp
PageOfficeCtrl poCtrl=new PageOfficeCtrl(request); poCtrl.setServerPage(request.getContextPath()+"/poserver.zz"); //打開Word文檔 poCtrl.webOpen("doc/test.doc",OpenModeType.docNormalEdit,"張佚名");
2. 在打開word文件的頁面(好比:word.jsp)裏顯示文件的區域添加PageOffice的代碼:工具
<div style=" width:1000px; height:650px;"> <%=poCtrl.getHtmlCode("PageOfficeCtrl1")%> </div>
3. 文件在線打開以後,經過按鈕或其餘方式調用執行下面的js,變量txt就能夠獲取到文檔條目化的內容:.net
var txt = document.getElementById("PageOfficeCtrl1").GetWordItemsConent();
4. 運行效果:excel
源碼下載: https://download.csdn.net/download/zi_wu_xian/10404732orm