java獲取word裏面的文本

需求場景   開發的web辦公系統如果需要處理大量的Word文檔(比如有成千上萬個文檔),用戶一定提出查找包含某些關鍵字的文檔的需求,這就要求能夠讀取 word 中的文字內容,而忽略其中的文字樣式、表格、圖片等信息。 方案分析   方案一:使用Apache POI技術將所有服務器上文檔的文本獲取後存儲到數據庫,查找文檔時利用sql語句檢索數據中存儲的文檔文本是否包含關鍵字來搜索到相關文檔。然而現在
相關文章
相關標籤/搜索