[926]flashtext:大規模數據清洗的利器

flashText介紹 在這篇文章中,咱們將介紹一種新的關鍵字搜索和替換的算法:Flashtext 算法。Flashtext 算法是一個高效的字符搜索和替換算法。該算法的時間複雜度不依賴於搜索或替換的字符的數量。好比,對於一個文檔有 N 個字符,和一個有 M 個詞的關鍵詞庫,那麼時間複雜度就是 O(N) 。這個算法比咱們通常的正則匹配法快不少,由於正則匹配的時間複雜度是 O(M * N)。這個算法
相關文章
相關標籤/搜索