深刻理解javascript---命名函數表達式

簡單的說,命名函數表達式只有一個用戶,那就是在Debug或者Profiler分析的時候來描述函數的名稱,也可使用函數名實現遞歸,但很快你就會發現實際上是不切實際的。固然,若是你不關注調試,那就沒什麼可擔憂的了,不然,若是你想了解兼容性方面的東西的話,你仍是應該繼續往下看看。html

咱們先開始看看,什麼叫函數表達式,而後再說一下現代調試器如何處理這些表達式。web

函數表達式和函數聲明?

在ECMAScript中,建立函數的最經常使用的兩個方法是函數表達式和函數聲明,二者期間的區別是有點暈,由於ECMA規範只明確了一點:函數聲明必須帶有標示符(Identifier)(就是你們常說的函數名稱),而函數表達式則能夠省略這個標示符json

函數聲明:數組

  function 函數名稱 (參數:可選){ 函數體 }瀏覽器

  函數表達式:性能優化

  function 函數名稱(可選)(參數:可選){ 函數體 }閉包

因此,能夠看出,若是不聲明函數名稱,它確定是表達式,可若是聲明瞭函數名稱的話,如何判斷是函數聲明仍是函數表達式呢?ECMAScript是經過上下文來區分的,若是function foo(){}是做爲賦值表達式的一部分的話,那它就是一個函數表達式,若是function foo(){}被包含在一個函數體內,或者位於程序的最頂部的話,那它就是一個函數聲明。函數

function foo () {};  // 函數聲明,由於她是程序的一部分

var bar = function  foo () {}; // 函數表達式,由於他是賦值表達式的一部分(也就是說把表達式付給了一個變量)

new function bar () {}; // 表達式,由於她是new表達式的一部分
( function() {
     function bar () {}; // 函數聲明,由於她是函數體的一部分
} )();

 還有一種函數表達式不太常見,就是被括號括住的(function foo(){}),他是表達式的緣由是由於括號 ()是一個分組操做符,它的內部只能包含表達式,咱們來看幾個例子:性能

function foo(){} // 函數聲明
  (function foo(){}); // 函數表達式:包含在分組操做符內
  
  try {
    (var x = 5); // 分組操做符,只能包含表達式而不能包含語句:這裏的var就是語句
  } catch(err) {
    // SyntaxError
  }

你能夠會想到,在使用eval對JSON進行執行的時候,JSON字符串一般被包含在一個圓括號裏:eval('(' + json + ')'),這樣作的緣由就是由於分組操做符,也就是這對括號,會讓解析器強制將JSON的花括號解析成表達式而不是代碼塊學習

 try {
    { "x": 5 }; // "{" 和 "}" 作解析成代碼塊
  } catch(err) {
    // SyntaxError
  }
  
  ({ "x": 5 }); // 分組操做符強制將"{" 和 "}"做爲對象字面量來解析

表達式和聲明存在着十分微妙的差異,首先,函數聲明會在任何表達式被解析和求值以前先被解析和求值,即便你的聲明在代碼的最後一行,它也會在同做用域內第一個表達式以前被解析/求值,參考以下例子,函數fn是在alert以後聲明的,可是在alert執行的時候,fn已經有定義了:

alert(fn());

  function fn() {
    return 'Hello world!';
  }

另外,還有一點須要提醒一下,函數聲明在條件語句內雖然能夠用,可是沒有被標準化,也就是說不一樣的環境可能有不一樣的執行結果,因此這樣狀況下,最好使用函數表達式:

  // 千萬別這樣作!
  // 由於有的瀏覽器會返回first的這個function,而有的瀏覽器返回的倒是第二個

  if (true) {
    function foo() {
      return 'first';
    }
  }
  else {
    function foo() {
      return 'second';
    }
  }
  foo();

  // 相反,這樣狀況,咱們要用函數表達式
  var foo;
  if (true) {
    foo = function() {
      return 'first';
    };
  }
  else {
    foo = function() {
      return 'second';
    };
  }
  foo();

 

函數聲明的實際規則以下:

注:函數聲明只能出如今程序或函數體內。從句法上講,它們 不能出如今Block(塊)({ ... })中,例如不能出如今 if、while 或 for 語句中。由於 Block(塊) 中只能包含Statement語句, 而不能包含函數聲明這樣的源元素。另外一方面,仔細看一看規則也會發現,惟一可能讓表達式出如今Block(塊)中情形,就是讓它做爲表達式語句的一部分。可是,規範明確規定了表達式語句不能以關鍵字function開頭。而這實際上就是說,函數表達式一樣也不能出如今Statement語句或Block(塊)中(由於Block(塊)就是由Statement語句構成的)。

函數語句

在ECMAScript的語法擴展中,有一個是函數語句,目前只有基於Gecko的瀏覽器實現了該擴展,因此對於下面的例子,咱們僅是抱着學習的目的來看,通常來講不推薦使用(除非你針對Gecko瀏覽器進行開發)。

1.通常語句能用的地方,函數語句也能用,固然也包括Block塊中:

 if (true) {
    function f(){ }
  }
  else {
    function f(){ }
  }

2.函數語句能夠像其餘語句同樣被解析,包含基於條件執行的情形

if (true) {
    function foo(){ return 1; }
  }
  else {
    function foo(){ return 2; }
  }
  foo(); // 1
  // 注:其它客戶端會將foo解析成函數聲明 
  // 所以,第二個foo會覆蓋第一個,結果返回2,而不是1

3.函數語句不是在變量初始化期間聲明的,而是在運行時聲明的——與函數表達式同樣。不過,函數語句的標識符一旦聲明能在函數的整個做用域生效了。標識符有效性正是致使函數語句與函數表達式不一樣的關鍵所在(下一小節咱們將會展現命名函數表達式的具體行爲)。

// 此刻,foo還沒用聲明
  typeof foo; // "undefined"
  if (true) {
    // 進入這裏之後,foo就被聲明在整個做用域內了
    function foo(){ return 1; }
  }
  else {
    // 歷來不會走到這裏,因此這裏的foo也不會被聲明
    function foo(){ return 2; }
  }
  typeof foo; // "function"

不過,咱們可使用下面這樣的符合標準的代碼來模式上面例子中的函數語句:

  var foo;
 // 'undefined'
if (true) { foo = function foo(){ return 1; }; } else { foo = function foo() { return 2; }; }

 

4.函數語句和函數聲明(或命名函數表達式)的字符串表示相似,也包括標識符:

if (true) {
    function foo(){ return 1; }
}
String(foo); // function foo() { return 1; }

5.另一個,早期基於Gecko的實現(Firefox 3及之前版本)中存在一個bug,即函數語句覆蓋函數聲明的方式不正確。在這些早期的實現中,函數語句不知何故不能覆蓋函數聲明:

  // 函數聲明
  function foo(){ return 1; }
  if (true) {
    // 用函數語句重寫
    function foo(){ return 2; }
  }
  foo(); // FF3如下返回1,FF3.5以上返回2
  
  // 不過,若是前面是函數表達式,則沒用問題
  var foo = function(){ return 1; };
  if (true) {
    function foo(){ return 2; }
  }
  foo(); // 全部版本都返回2

再次強調一點,上面這些例子只是在某些瀏覽器支持,因此推薦你們不要使用這些,除非你就在特性的瀏覽器上作開發.

命名函數表達式

函數表達式在實際應用中仍是很常見的,在web開發中友個經常使用的模式是基於對某種特性的測試來假裝函數定義,從而達到性能優化的目的,但因爲這種方式都是在同一做用域內,因此基本上必定要用函數表達式:

 var contains = (function() {
    var docEl = document.documentElement;

    if (typeof docEl.compareDocumentPosition != 'undefined') {
      return function(el, b) {
        return (el.compareDocumentPosition(b) & 16) !== 0;
      };
    }
    else if (typeof docEl.contains != 'undefined') {
      return function(el, b) {
        return el !== b && el.contains(b);
      };
    }
    return function(el, b) {
      if (el === b) return false;
      while (el != b && (b = b.parentNode) != null);
      return el === b;
    };
  })();

提到命名函數表達式,理所固然,就是它得有名字,前面的例子var bar = function foo(){};就是一個有效的命名函數表達式,但有一點須要記住:這個名字只在新定義的函數做用域內有效,由於規範規定了標示符不能在外圍的做用域內有效

  var f = function foo(){
    return typeof foo; // foo是在內部做用域內有效
  };
  // foo在外部用因而不可見的
  typeof foo; // "undefined"
  f(); // "function"

既然,這麼要求,那命名函數表達式到底有啥用啊?爲啥要取名?

正如咱們開頭所說:給它一個名字就是可讓調試過程更方便,由於在調試的時候,若是在調用棧中的每一個項都有本身的名字來描述,那麼調試過程就太爽了,感覺不同嘛。

var f = function foo(){
    return typeof foo; // foo是在內部做用域內有效
  };
  // foo在外部用因而不可見的
  typeof foo; // "undefined"
  f(); // "function"

 

既然,這麼要求,那命名函數表達式到底有啥用啊?爲啥要取名?

正如咱們開頭所說:給它一個名字就是可讓調試過程更方便,由於在調試的時候,若是在調用棧中的每一個項都有本身的名字來描述,那麼調試過程就太爽了,感覺不同嘛。

調試器中的函數名

若是一個函數有名字,那調試器在調試的時候會將它的名字顯示在調用的棧上。有些調試器(Firebug)有時候還會爲大家函數取名並顯示,讓他們和那些應用該函數的便利具備相同的角色,但是一般狀況下,這些調試器只安裝簡單的規則來取名,因此說沒有太大價格,咱們來看一個例子

 function foo(){
    return bar();
  }
  function bar(){
    return baz();
  }
  function baz(){
    debugger;
  }
  foo();

  // 這裏咱們使用了3個帶名字的函數聲明
  // 因此當調試器走到debugger語句的時候,Firebug的調用棧上看起來很是清晰明瞭 
  // 由於很明白地顯示了名稱
  baz
  bar
  foo
  expr_test.html()

經過查看調用棧的信息,咱們能夠很明瞭地知道foo調用了bar, bar又調用了baz(而foo自己有在expr_test.html文檔的全局做用域內被調用),不過,還有一個比較爽地方,就是剛纔說的Firebug爲匿名錶達式取名的功能:

function foo(){
    return bar();
  }
  var bar = function(){
    return baz();
  }
  function baz(){
    debugger;
  }
  foo();

  // Call stack
  baz
  bar() //看到了麼? 
  foo
  expr_test.html()

而後,當函數表達式稍微複雜一些的時候,調試器就不那麼聰明瞭,咱們只能在調用棧中看到問號:

function foo(){
    return bar();
  }
  var bar = (function(){
    if (window.addEventListener) {
      return function(){
        return baz();
      };
    }
    else if (window.attachEvent) {
      return function() {
        return baz();
      };
    }
  })();
  function baz(){
    debugger;
  }
  foo();

  // Call stack
  baz
  (?)() // 這裏但是問號哦
  foo
  expr_test.html()

另外,當把函數賦值給多個變量的時候,也會出現使人鬱悶的問題:

 function foo(){
    return baz();
  }
  var bar = function(){
    debugger;
  };
  var baz = bar;
  bar = function() { 
    alert('spoofed');
  };
  foo();

  // Call stack:
  bar()
  foo
  expr_test.html()

這時候,調用棧顯示的是foo調用了bar,但實際上並不是如此,之因此有這種問題,是由於baz和另一個包含alert('spoofed')的函數作了引用交換所致使的。

歸根結底,只有給函數表達式取個名字,纔是最委託的辦法,也就是使用命名函數表達式。咱們來使用帶名字的表達式來重寫上面的例子(注意當即調用的表達式塊裏返回的2個函數的名字都是bar):

  function foo(){
    return bar();
  }
  var bar = (function(){
    if (window.addEventListener) {
      return function bar(){
        return baz();
      };
    }
    else if (window.attachEvent) {
      return function bar() {
        return baz();
      };
    }
  })();
  function baz(){
    debugger;
  }
  foo();

  // 又再次看到了清晰的調用棧信息了耶!
  baz
  bar
  foo
  expr_test.html()

JScript的Bug

比較惡的是,IE的ECMAScript實現JScript嚴重混淆了命名函數表達式,搞得現不少人都出來反對命名函數表達式,並且即使是最新的一版(IE8中使用的5.8版)仍然存在下列問題。

下面咱們就來看看IE在實現中究竟犯了那些錯誤,俗話說知已知彼,才能百戰不殆。咱們來看看以下幾個例子:

例1:函數表達式的標示符泄露到外部做用域

    var f = function g(){};
    typeof g; // "function"

上面咱們說過,命名函數表達式的標示符在外部做用域是無效的,但JScript明顯是違反了這一規範,上面例子中的標示符g被解析成函數對象,這就亂了套了,不少難以發現的bug都是由於這個緣由致使的。

注:IE9貌似已經修復了這個問題

例2:將命名函數表達式同時看成函數聲明和函數表達式

   typeof g; // "function"
   var f = function g(){};

特性環境下,函數聲明會優先於任何表達式被解析,上面的例子展現的是JScript其實是把命名函數表達式當成函數聲明瞭,由於它在實際聲明以前就解析了g。

這個例子引出了下一個例子。
例3:命名函數表達式會建立兩個大相徑庭的函數對象!

    var f = function g(){};
    f === g; // false

    f.expando = 'foo';
    g.expando; // undefined

再來看一個稍微複雜的例子:

例4:僅僅順序解析函數聲明而忽略條件語句塊

   var f = function g() {
      return 1;
    };
    if (false) {
      f = function g(){
        return 2;
      };
    }
    g(); // 2

這個bug查找就難多了,但致使bug的緣由卻很是簡單。首先,g被看成函數聲明解析,因爲JScript中的函數聲明不受條件代碼塊約束,因此在這個很惡的if分支中,g被看成另外一個函數function g(){ return 2 },也就是又被聲明瞭一次。而後,全部「常規的」表達式被求值,而此時f被賦予了另外一個新建立的對象的引用。因爲在對錶達式求值的時候,永遠不會進入「這個可惡if分支,所以f就會繼續引用第一個函數function g(){ return 1 }。分析到這裏,問題就很清楚了:假如你不夠細心,在f中調用了g,那麼將會調用一個絕不相干的g函數對象。

你可能會問,將不一樣的對象和arguments.callee相比較時,有什麼樣的區別呢?咱們來看看:

 var f = function g(){
    return [
      arguments.callee == f,
      arguments.callee == g
    ];
  };
  f(); // [true, false]
  g(); // [false, true]

能夠看到,arguments.callee的引用一直是被調用的函數,實際上這也是好事,稍後會解釋。

還有一個有趣的例子,那就是在不包含聲明的賦值語句中使用命名函數表達式:

  (function(){
    f = function f(){};
  })();

按照代碼的分析,咱們本來是想建立一個全局屬性f(注意不要和通常的匿名函數混淆了,裏面用的是帶名字的生命),JScript在這裏搗亂了一把,首先他把表達式當成函數聲明解析了,因此左邊的f被聲明爲局部變量了(和通常的匿名函數裏的聲明同樣),而後在函數執行的時候,f已是定義過的了,右邊的function f(){}則直接就賦值給局部變量f了,因此f根本就不是全局屬性。

瞭解了JScript這麼變態之後,咱們就要及時預防這些問題了,首先防範標識符泄漏帶外部做用域,其次,應該永遠不引用被用做函數名稱的標識符;還記得前面例子中那個討人厭的標識符g嗎?——若是咱們可以當g不存在,能夠避免多少沒必要要的麻煩哪。所以,關鍵就在於始終要經過f或者arguments.callee來引用函數。若是你使用了命名函數表達式,那麼應該只在調試的時候利用那個名字。最後,還要記住一點,必定要把命名函數表達式聲明期間錯誤建立的函數清理乾淨

對於,上面最後一點,咱們還得再解釋一下。

JScript的內存管理

知道了這些不符合規範的代碼解析bug之後,咱們若是用它的話,就會發現內存方面實際上是有問題的,來看一個例子:

  var f = (function(){
    if (true) {
      return function g(){};
    }
    return function g(){};
  })();

咱們知道,這個匿名函數調用返回的函數(帶有標識符g的函數),而後賦值給了外部的f。咱們也知道,命名函數表達式會致使產生多餘的函數對象,而該對象與返回的函數對象不是一回事。因此這個多餘的g函數就死在了返回函數的閉包中了,所以內存問題就出現了。這是由於if語句內部的函數與g是在同一個做用域中被聲明的。這種狀況下 ,除非咱們顯式斷開對g函數的引用,不然它一直佔着內存不放。

 var f = (function(){
    var f, g;
    if (true) {
      f = function g(){};
    }
    else {
      f = function g(){};
    }
    // 設置g爲null之後它就不會再佔內存了
    g = null;
    return f;
  })();

經過設置g爲null,垃圾回收器就把g引用的那個隱式函數給回收掉了,爲了驗證咱們的代碼,咱們來作一些測試,以確保咱們的內存被回收了。

測試很簡單,就是命名函數表達式建立10000個函數,而後把它們保存在一個數組中。等一下子之後再看這些函數到底佔用了多少內存。而後,再斷開這些引用並重復這一過程。下面是測試代碼:

 function createFn(){
    return (function(){
      var f;
      if (true) {
        f = function F(){
          return 'standard';
        };
      }
      else if (false) {
        f = function F(){
          return 'alternative';
        };
      }
      else {
        f = function F(){
          return 'fallback';
        };
      }
      // var F = null;
      return f;
    })();
  }

  var arr = [ ];
  for (var i=0; i<10000; i++) {
    arr[i] = createFn();
  }

經過運行在Windows XP SP2中的任務管理器能夠看到以下結果:

 IE6:

    without `null`:   7.6K -> 20.3K
    with `null`:      7.6K -> 18K

  IE7:

    without `null`:   14K -> 29.7K
    with `null`:      14K -> 27K

如咱們所料,顯示斷開引用能夠釋放內存,可是釋放的內存不是不少,10000個函數對象才釋放大約3M的內存,這對一些小型腳本不算什麼,但對於大型程序,或者長時間運行在低內存的設備裏的時候,這是很是有必要的。

關於在Safari 2.x中JS的解析也有一些bug,但介於版本比較低,因此咱們在這裏就不介紹了,你們若是想看的話,請仔細查看英文資料。

相關文章
相關標籤/搜索