以前偶然看到一篇使用正則實現字符去重及多行去重的文章。感受寫的有點糙,並且性能也不夠高,對新手的使用和理解都有一點難度。因而忍不住就搞了一個比較可愛的出來。並且不是通常的可愛,由於隨着字符量的增加,其性能甩出前者不知道多少條街。javascript
這裏的實現對知識點的要求很是的低,不論你是老司機仍是菜鳥,基本上一眼就能看到其真諦;html
Array.from()
[不知道?],固然你能夠能夠用經典的slice.call()
來輕鬆搞定古董瀏覽器們;Array.prototype.reduce(Func[, initialValue]):Array|TypeLike[initialValue]
,它被普遍應用於各類求值操做,這裏就不細講了;String.prototype.match(string|RegExp):null|Array
;Array.prototype.split(string|RegRxp):Array
;Array.prototype.includes(string):boolean
,固然,你也可使用其餘接口如:indexOf()
、find()
、some()
等;注意:本文不涉及對底層接口運行原理的解析。若有感興趣,請自行查閱相關文檔,進一步的瞭解前端的性能優化;
//單行文本去重 function SingleLineDistinct (str) { // Array.prototype.slice.call(str|new String(str)) 可兼容不支持from接口的瀏覽器 return Array.from(str).reduce( // 這裏應該很好明白是在幹什麼吧? (pre,cur) => (pre.match(cur) ? pre : pre + cur), // 須要傳入一個初始空字符串參數,不然你將獲得的是一個字符串被拆分後的數組。 "" ); }
多行字符去重直接就是基於單行去重的簡單封裝前端
function MultiLineCharDistinct (mlstr) { // 是否是超級簡單? return mlstr.split("\n").map(SingleLineDistinct).join("\n") }
這個也是很是的簡單的,用一下數組判斷接口就行啦。java
function MultiLineDistinct (str, spl = "\n") { // 這裏就不能給reduce傳入初始空字符串了,由於那樣會返回 return str.split(spl).reduce( // 判斷一下,初始數組中有沒有與當前行相同的字符串,沒有則push當前行,並返回數組; (pre,cur) => (!pre.includes(cur) && pre.push(cur),pre), [] ) // 進行行拆分 .join(spl); }
這裏仍是貼一下前面提到的運用正則進行單行去重的代碼吧:正則表達式
function DistinctString(s){ var a; while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a; return s; }
接下來咱們就來進行兩個單行去重函數的性能進行比較了:【高能預警!】編程
首先,咱們給SingleLineDistinct()
和DistinctString()
函數添加執行時間打印console.time()
和console.timeEnd()
[這裏非本文重點,不作應用闡述],變成了這樣:數組
function DistinctString(s){ console.time('dstring'); var a; while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a; console.timeEnd('dstring'); return s; }
//單行文本去重 function SingleLineDistinct (str) { console.time('sldist'); str = Array.from(str).reduce( (pre,cur) => (pre.match(cur) ? pre : pre + cur), "" ); console.timeEnd('sldist'); return str; }
咱們定義一個let str = "lsdjfl...."
的隨機重複字符變量,而後就該它們倆發揮了:瀏覽器
咦~~,彼此彼此嘛...性能優化
DistinctString:很差意思,失誤,再來!函數
DistinctString:SingleLineDistinct你等等我呀!
SingleLineDistinct:很差意思,你實在太慢了。
哈哈哈哈,怎麼樣,是否是頗有趣?但願你各位喜歡。若是大家有更好更快的方法,歡迎交流喲~
聲明:本文的內容並非對正則表達式的否認,正則的牛逼之處是無可替代的,請各位不要誤解。僅僅是想經過這樣一個栗子,告訴你們每一種方法都有它的長處和短處。想要編寫高性能、高質量的代碼,那麼你就必需要了解其運行原理和底層技術,這樣才能讓你在編程時選擇更好的代碼組織模式,提升應用的執行效率。