JS單行、多行文本字符去重和行去重

以前偶然看到一篇使用正則實現字符去重及多行去重的文章。感受寫的有點糙,並且性能也不夠高,對新手的使用和理解都有一點難度。因而忍不住就搞了一個比較可愛的出來。並且不是通常的可愛,由於隨着字符量的增加,其性能甩出前者不知道多少條街。javascript

知識點

這裏的實現對知識點的要求很是的低,不論你是老司機仍是菜鳥,基本上一眼就能看到其真諦;html

  • 超好用的Array.from()[不知道?],固然你能夠能夠用經典的slice.call()來輕鬆搞定古董瀏覽器們;
  • Array口杯接口Array.prototype.reduce(Func[, initialValue]):Array|TypeLike[initialValue],它被普遍應用於各類求值操做,這裏就不細講了;
  • 高顏值的String.prototype.match(string|RegExp):null|Array
  • 使用評率最高的Array.prototype.split(string|RegRxp):Array;
  • 新的Array.prototype.includes(string):boolean,固然,你也可使用其餘接口如:indexOf()find()some()等;
  • 正則表達式
注意:本文不涉及對底層接口運行原理的解析。若有感興趣,請自行查閱相關文檔,進一步的瞭解前端的性能優化;

單行文本去重

//單行文本去重
function SingleLineDistinct (str) {
    // Array.prototype.slice.call(str|new String(str)) 可兼容不支持from接口的瀏覽器
    return Array.from(str).reduce(
        // 這裏應該很好明白是在幹什麼吧?
        (pre,cur) => (pre.match(cur) ? pre : pre + cur), 
        // 須要傳入一個初始空字符串參數,不然你將獲得的是一個字符串被拆分後的數組。
        ""
    ); 
}

多行字符去重

多行字符去重直接就是基於單行去重的簡單封裝前端

function MultiLineCharDistinct (mlstr) {
    // 是否是超級簡單?
    return mlstr.split("\n").map(SingleLineDistinct).join("\n")
}

多行行去重

這個也是很是的簡單的,用一下數組判斷接口就行啦。java

function MultiLineDistinct (str, spl = "\n") {
    // 這裏就不能給reduce傳入初始空字符串了,由於那樣會返回
    return str.split(spl).reduce(
        // 判斷一下,初始數組中有沒有與當前行相同的字符串,沒有則push當前行,並返回數組;
        (pre,cur) => (!pre.includes(cur) && pre.push(cur),pre),
        []
    )
    // 進行行拆分
    .join(spl); 
}

見證奇蹟的時刻到了

這裏仍是貼一下前面提到的運用正則進行單行去重的代碼吧:正則表達式

function DistinctString(s){
    var a;
    while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a;
    return s;
}

接下來咱們就來進行兩個單行去重函數的性能進行比較了:【高能預警!】編程

首先,咱們給SingleLineDistinct()DistinctString()函數添加執行時間打印console.time()console.timeEnd()[這裏非本文重點,不作應用闡述],變成了這樣:數組

function DistinctString(s){
    console.time('dstring');
    var a;
    while((a=s.replace(/(.)(.*?)\1/,"$1$2"))!=s) s=a;
    console.timeEnd('dstring');
    return s;
}
//單行文本去重
function SingleLineDistinct (str) {
    console.time('sldist');
    str = Array.from(str).reduce(
        (pre,cur) => (pre.match(cur) ? pre : pre + cur), 
        ""
    ); 
    console.timeEnd('sldist');
    return str;
}

咱們定義一個let str = "lsdjfl...."的隨機重複字符變量,而後就該它們倆發揮了:瀏覽器

clipboard.png
咦~~,彼此彼此嘛...性能優化

clipboard.png
DistinctString:很差意思,失誤,再來!函數

clipboard.png
DistinctString:SingleLineDistinct你等等我呀!

clipboard.png
SingleLineDistinct:很差意思,你實在太慢了。

哈哈哈哈,怎麼樣,是否是頗有趣?但願你各位喜歡。若是大家有更好更快的方法,歡迎交流喲~

聲明:本文的內容並非對正則表達式的否認,正則的牛逼之處是無可替代的,請各位不要誤解。僅僅是想經過這樣一個栗子,告訴你們每一種方法都有它的長處和短處。想要編寫高性能、高質量的代碼,那麼你就必需要了解其運行原理和底層技術,這樣才能讓你在編程時選擇更好的代碼組織模式,提升應用的執行效率。
相關文章
相關標籤/搜索