[轉載]JavaScript 中小數和大整數的精度丟失

先來看兩個問題:php

0.1 + 0.2 == 0.3; // false 9999999999999999 == 10000000000000000; // true

第一個問題是小數的精度問題,在業界很多博客裏已有討論。第二個問題,去年公司有個系統的數據庫在作數據訂正時,發現有部分數據重複的詭異現象。本文將從規範出發,對上面的問題作個小結。html

 

最大整數java

JavaScript 中的數字是用 IEEE 754 雙精度 64 位浮點數 來存儲的,其格式爲:git

s x m x 2^egithub

s 是符號位,表示正負。 m 是尾數,有 52 bits. e 是指數,有 11 bits. 在 ECMAScript 規範 裏有給出 e 的範圍爲 [-1074, 971]. 這樣,很容易推導出 JavaScript 能表示的最大整數爲:web

1 x (2^53 - 1) x 2^971 = 1.7976931348623157e+308數據庫

這個值正是 Number.MAX_VALUE編程

同理可推導出 Number.MIN_VALUE 的值爲:windows

1 x 1 x 2^(-1074) = 5e-324

注意 MIN_VALUE 表示最接近 0 的正數,而不是最小的數。最小的數是 -Number.MAX_VALUE

小數的精度丟失

十進制 0.1 的二進制爲 0.0 0011 0011 0011 … (循環 0011)
十進制 0.2 的二進制爲 0.0011 0011 0011 … (循環 0011)

0.1 + 0.2 相加可表示爲:
   e = -4; m = 1.10011001100...1100(52 位)
 + e = -3; m = 1.10011001100...1100(52 位)
---------------------------------------------
   e = -3; m = 0.11001100110...0110
 + e = -3; m = 1.10011001100...1100
---------------------------------------------
   e = -3; m = 10.01100110011...001
---------------------------------------------
 = 0.01001100110011...001
 = 0.30000000000000004(十進制)

根據上面的演算,還能夠得出一個結論:當十進制小數的二進制表示的有限數字不超過 52 位時,在 JavaScript 裏是能夠精確存儲的。好比:

0.05 + 0.005 == 0.055 // true

進一步的規律,好比:

0.05 + 0.2 == 0.25 // true 0.05 + 0.9 == 0.95 // false

須要考慮 IEEE 754 的 Rounding modes, 有興趣的可進一步研究。

大整數的精度丟失

這個問題鮮有人說起。首先得弄清楚問題是什麼:

1. JavaScript 能存儲的最大整數是什麼?

該問題前面已回答,是 Number.MAX_VALUE, 很是大的一個數。

2. JavaScript 能存儲的且不丟失精度的最大整數是什麼?

根據 s x m x 2^e, 符號位取正,52 位尾數全填充 1, 指數 e 取最大值 971, 顯然,答案依舊是 Number.MAX_VALUE.

咱們的問題到底是什麼呢?回到起始代碼:

9999999999999999 == 10000000000000000; // true

很明顯,16 個 9 還遠遠小於 308 個 10. 這個問題與 MAX_VALUE 沒什麼關係,還得歸屬到尾數 m 只有 52 位上來。

能夠用代碼來描述:

var x = 1; // 爲了減小運算量,初始值能夠設大一點,好比 Math.pow(2, 53) - 10 while(x != x + 1) x++; // x = 9007199254740992 即 2^53

也就是說,當 x 小於等於 2^53 時,能夠確保 x 的精度不會丟失。當 x 大於 2^53 時,x 的精度有可能會丟失。好比:

x 爲 2^53 + 1 時,其二進制表示爲: 10000000000...001 (中間共有 52 個 0) 用雙精度浮點數存儲時: e = 1; m = 10000..00(共 52 個 0,其中 1 是 hidden bit) 顯然,這和 2^53 的存儲是同樣的。

按照上面的思路能夠推出,對於 2^53 + 2, 其二進制爲 100000…0010(中間 51 個 0),也是能夠精確存儲的。

規律:當 x 大於 2^53 且二進制有效位數大於 53 位時,就會存在精度丟失。這和小數的精度丟失本質上是同樣的。

hidden bit 可參考:A tutorial about Java double type.

小結

小數和大整數的精度丟失,並不單單在 JavaScript 中存在。嚴格來講,使用了IEEE 754 浮點數格式來存儲浮點類型的任何編程語言(C/C++/C#/Java 等等)都存在精度丟失問題。在 C#、Java 中,提供了 Decimal、BigDecimal 封裝類來進行相應的處理,才避開了精度丟失。

注:ECMAScript 規範中,已有 decimal proposal,但目前還沒有被正式採納。

最後考考你們:

Number.MAX_VALUE + 1 == Number.MAX_VALUE; Number.MAX_VALUE + 2 == Number.MAX_VALUE; ... Number.MAX_VALUE + x == Number.MAX_VALUE; Number.MAX_VALUE + x + 1 == Infinity; ... Number.MAX_VALUE + Number.MAX_VALUE == Infinity; // 問題: // 1. x 的值是什麼? // 2. Infinity - Number.MAX_VALUE == x + 1; 是 true 仍是 false ?
參考資料

原文連接:JavaScript 中小數和大整數的精度丟失

隨機文章:

  1. 不過冬至好多年
  2. 在Windows下源碼編譯PHP
  3. VBS調用IE對象直接打印網頁
  4. Windows 7音頻服務未運行的解決方法
  5. 一個VBS惡做劇程序的解密
相關文章
相關標籤/搜索