使用Tika進行非結構化內容的讀寫-1

    前綴時間在使用Jackrabbit作非結構化內容的存取,當問到當存取一個word文檔時,jackrabbit能不能對word文檔裏面的內容作全文檢索呢。回去查了一下相關的文檔,是可以的,而且用的是一個叫Tika的工具。     Tika原先是一個Lucene的子項目,即對內容作元數據抽取用。更多的時候,是對一個平時所用的文檔類數據作信息的進一步讀取,這些信息是隱藏在文檔本身的。這就要求有一
相關文章
相關標籤/搜索