JQuery中trim函數的具體實現代碼

因爲Javascript 1.8.1 以前的版本,沒有內置 trim 函數,因此 JQuery 對它有本身的實現。不一樣的JQuery版本,trim函數的實現也不盡相同。html

閱讀本文須要掌握正則表達式用法,若是不是很瞭解,建議閱讀這個。若是隻是想了解一下,建議讀我寫的 5分鐘讀懂正則表達式正則表達式

鑑於正則表達式的強大用途(在各類語言如JS,Python,Ruby,Java中都會用到),建議重點學習並掌握。數組

 

JQuery 1.7.2版本瀏覽器


 

// 截取的部分源碼,不是完整語句,旨在說明實現過程
trimLeft = /^\s+/,
trimRight = /\s+$/,

text.toString().replace( trimLeft, "" ).replace( trimRight, "" );

簡化後就是ruby

yourstr.replace( /^\s+/, "" ).replace(/\s+$/, "" )
// 正則表達式 /^\s/     匹配以空白字符串開頭的字符串
// 正則表達式 /\s+$/   匹配以空白字符串結尾的字符串
//replace參數,左邊是查找模式,右邊是替換量,返回替換後的字符串

 

JQuery 2.1.1 版本函數


 

var whitespace = "[\\x20\\t\\r\\n\\f]",
    rtrim = new RegExp( "^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)" + whitespace + "+$", "g" );
//....
trim: function( text ) {
    return text == null ?
        "" :
        ( text + "" ).replace( rtrim, "" );
},

合併以後,從字符串轉變爲正則表達式(各去掉一個反斜線!)性能

字符串  "^[\\x20\\t\\r\\n\\f]+|((?:^|[^\\\\])(?:\\\\.)*)[\\x20\\t\\r\\n\\f]+$"
正則表達式   /^[\x20\t\r\n\f]+|((?:^|[^\\])(?:\\.)*)[\x20\t\r\n\f]+$/g
//其實,若不考慮轉義,空白符用...替代
//可這麼理解(注意:這麼寫只是幫助理解,不是內部原理)
/ ^ [...]+ | ( (?: ^ | [^\] ) (?:.)* ) [...]+ $/g
//(?:) 可同義替換爲 ()
/ ^ [...]+ | ( ( ^ | [^\] )) (.)* )    [...]+ $/g

 

細看會發現其實它是有兩個部分組合的。一是:whitespace,一是 ((?:^|[^\\\\])(?:\\\\.)*)。其中whitespace就是空格符,製表符,回車符,換行符,翻頁符。學習

下面細細說說後面這串表達式含義。優化

 

由簡入繁:this

/^[...]+ | ( (?: ) ( )* ) [...]+ $/g
/^[...]+ | ( (?: ^ | [^\\] ) (?:\\.)* ) [...]+ $/g
//(?:)             可同義替換爲 ()    
//[^\\]            除了\的任一字符
//(^|[^\\])        開頭沒有字符 或 非\的字符
//(?:\\.)*         任一字符(不含\n換行符)重複0或屢次
// | 後面意思就是    開頭沒有字符(即下個字符即爲原始串的第一個字符)或是非\字符(此時才1位字符)
//                 和除了換行符的任意字符串
//                 和一個whitespace,而後字符串結束
//
//固然 | 前面無非就是匹配以 whitespace 開頭而已

 

 

其實,實現 trim 函數不止有以上幾種辦法,並且 JQuery 採用的也不是最好的。這裏是一些其它的實現:

 

實現1

String.prototype.trim=function(){returnthis.replace(/^\s\s*/,'').replace(/\s\s*$/,'');}

看起來不怎麼樣,動用了兩次正則替換,實際速度很是驚人,主要得益於瀏覽器的內部優化。一個著名的例子字符串拼接,直接相加比用Array作成的StringBuffer還快。base2類庫使用這種實現.

 

實現2

String.prototype.trim=function(){returnthis.replace(/^\s+/,'').replace(/\s+$/,'');}

和實現1很類似,但稍慢一點,主要緣由是它最早是假設至少存在一個空白符。Prototype.js使用這種實現,不過其名字爲strip,由於Prototype的方法都是力求與Ruby同名。能夠看到Jquery1.7版本也是用的這個方法。

 

實現3

String.prototype.trim=function(){returnthis.substring(Math.max(this.search(/\S/),0),this.search(/\S\s*$/)+1);}

以截取方式取得空白部分(固然容許中間存在空白符),總共調用了四個原生方法。設計得很是巧妙,substring以兩個數字做爲參數。Math.max以兩個數字做參數,search則返回一個數字。速度比上面兩個慢一點,但比下面大多數都快。

 

實現4

String.prototype.trim=function(){returnthis.replace(/^\s+|\s+$/g,'');}

這個能夠稱得上實現2的簡化版,就是利用候選操做符鏈接兩個正則。但這樣作就失去了瀏覽器優化的機會,比不上實現3。因爲看來很優雅,許多類庫都使用它,如JQuery與mootools

 

實現5

String.prototype.trim=function(){var str =this; str = str.match(/\S+(?:\s+\S+)*/);return str ? str[0]:'';}

match是返回一個數組,所以原字符串符合要求的部分就成爲它的元素。爲了防止字符串中間的空白符被排除,咱們須要動用到非捕獲性分組(?:exp)。因爲數組可能爲空,咱們在後面還要作進一步的斷定。好像瀏覽器在處理分組上比較無力,一個字慢。因此不要迷信正則,雖然它基本上是萬能的。

 

實現6

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(\s+\S+)*)\s*$/,'$1');}

把符合要求的部分提供出來,放到一個空字符串中。不過效率不好,尤爲是在IE6中。

 

實現7

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(?:\s+\S+)*)\s*$/,'$1');}

和實現6很類似,但用了非捕獲分組進行了優勢,性能效之有一點點提高。

 

實現8

String.prototype.trim=function(){returnthis.replace(/^\s*((?:[\S\s]*\S)?)\s*$/,'$1');}

沿着上面兩個的思路進行改進,動用了非捕獲分組與字符集合,用?頂替了*,效果很是驚人。尤爲在IE6中,能夠用瘋狂來形容此次性能的提高,直接秒殺火狐。

 

實現9

String.prototype.trim=function(){returnthis.replace(/^\s*([\S\s]*?)\s*$/,'$1');}

此次是用懶惰匹配頂替非捕獲分組,在火狐中獲得改善,IE沒有上次那麼瘋狂。

 

實現10

String.prototype.trim=function()
{
var str =this, whitespace =' \n\r\t\f\x0b\xa0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000';

for(var i =0,len = str.length; i < len; i++){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(i);break;
  }
}

for(i = str.length-1; i >=0; i--){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(0, i +1);break;   } } return whitespace.indexOf(str.charAt(0))===-1? str :''; }

我只想說,搞出這個的人已經不是用牛來形容,已經是神同樣的級別。它先是把可能的空白符所有列出來,在第一次遍歷中砍掉前面的空白,第二次砍掉後面的空白。全過程只用了indexOf與substring這個專門爲處理字符串而生的原生方法,沒有使用到正則。速度快得驚人,估計直逼上內部的二進制實現,而且在IE與火狐(其餘瀏覽器固然也毫無疑問)都有良好的表現。速度都是零毫秒級別的。

 

實現11

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s+/,'');
for(var i = str.length-1; i >=0; i--){
    if(/\S/.test(str.charAt(i))){
      str =str.substring(0, i +1);
    break;
  }
}

return str;
}

實現10已經告訴咱們普通的原生字符串截取方法是遠勝於正則替換,雖然是複雜一點。但只要正則不過於複雜,咱們就能夠利用瀏覽器對正則的優化,改善程序執行效率,如實現8在IE的表現。我想一般不會有人在項目中應用實現10,由於那個whitespace 實現太長太難記了(固然若是你在打造一個類庫,它絕對是首先)。實現11可謂其改進版,前面部分的空白由正則替換負責砍掉,後面用原生方法處理,效果不遜於原版,但速度都是很是逆天。

 

實現12

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s\s*/,''), ws =/\s/, i = str.length;
while (ws.test(str.charAt(--i)));

return str.slice(0, i +1);
}

實現10與實現11在寫法上更好的改進版,注意說的不是性能速度,而是易記與使用上。和它的兩個前輩都是零毫秒級別的,之後就用這個來工做與嚇人。

下面是老外給出的比較結果,執行背景是對Magna Carta 這文章(超過27,600字符)進行trim操做。

 

內容參考:Javascript trim函數大賞

相關文章
相關標籤/搜索