文本分析算法簡單介紹-1

        以下內容是基於李博《機器學習實踐應用》,鄒博小象學院《機器學習課程》以及李航書籍《統計學習方法》加上自己的理解提煉而成 文本分析算法大致可以分成3種方法:機械分詞,統計分詞和機器學習分詞。 1)機械分詞:機械分詞就是從一個很大的詞庫種找出匹配的詞語,將其篩選出來。該方法實現非常簡單,但是有一些問題:效率問題,因爲要遍歷一邊詞庫,所以複雜度將會是O(m * n),m代表的是文檔中文字
相關文章
相關標籤/搜索