信息檢索

搜索文檔或文檔中信息的科學。文檔能夠是文本或多媒體,而且可能駐留在Web上。 信息檢索與數據庫系統的差異:信息檢索假定所搜索的數據是無結構的;信息檢索查詢主要用關鍵詞,沒有複雜的結構。 主題模型:一個文本文檔集的主題能夠用詞彙表上的機率分佈建模。web 文件類型檢測 語言檢測 檢測文件語言類型檢測特定字符 使用split()對文本內容進行區分,區分不一樣詞語,進行標記 標記化數據庫 倒排索引svg
相關文章
相關標籤/搜索