只有1%的Python 程序員搞懂過浮點數陷阱

容純乾貨,先從一個例子提及算法

>>> 0.1+0.2==0.3
False

當你第一次看到這個結果時可能會很是驚訝,原來還有個這麼大的bug,再來看看錶達式 0.1+0.2 到底等於多少?編程

>>> 0.1+0.2
0.30000000000000004

徹底超出咱們的想象。那麼這個操做在計算機裏面到底發生了什麼事情?函數

咱們仍是回到二進制。工具

首先,須要明確一點,在計算機中不管是整數、浮點數、仍是字符串最終都是用二進制來表示的。學習

整數的二進制表示法

整數 9 在計算機中二進制表示是: 1001 ,怎麼得來的?開發工具

用十進制整數整除以2,獲得商和餘數,該餘數就是二進制數的最低位,而後繼續用商整除以2,獲得新的商和餘數,以此類推,直到商等於0,由全部餘數倒排組成了該整數的二進制表現形式。用代碼表示是:code

>>> n = 9
>>> while n >0:
    n,e = divmod(n, 2) # divmod返回n除以2的商和餘數
    print(e)
1 # 低位
0
0
1 # 高位

二進制轉化爲十進制整數

咱們知道,十進制用科學計算法可表示爲:開發

123 = 1*10^2 + 2*10^1 + 3*10^0 
= 100 + 20 + 3 
= 123

一樣的道理,若是是二進制數,可表示:字符串

1001 = 1*2^3 + 0*2^2 +0*2^1 + 1*2^0
= 8+0+0+1 
= 9

再來看浮點數it

浮點數的二進制表示法

二進制小數和二進制整數沒什麼區別,都是由0和1組成,只是多了一個點,例如:101.11 就是一個二進制小數,對應的十進制數是:

101.11 = 1*2^2 + 0*2^1 + 1*2^0 + 1*2^-1 + 1* 2^-2
= 4 + 0 + 1 + 1/2 + 1/4
= 5 + 0.5 + 0.25
= 5.75

小數點左邊用 2^n 表示,小數點右邊的值用 2^-n來表示。

浮點數轉換成二進制小數

十進制的浮點數轉換成二進制小數的步驟:

  • 小數點前面的整數部分按照十進制轉二進制的方式操做

  • 小數部分乘以2,取整數0或者1,剩下的小數繼續乘2一直重複,直到小數部分爲0或達到指定的精度爲止

例如 2.25 轉換成二進制小數,整數2轉換爲二進制是 10, 小數部分0.25轉換二進制是:

0.25 * 2 = 0.5  整數爲0,小數爲0.5
0.5 * 2 = 1.0   整數爲1,小數爲0

因此 2.25 表示成二進制小數是 10.01 , 但並非每個浮點數都這麼幸運最後乘2小數爲0的,好比 0.2 轉換成二進制是:

0.2*2 = 0.4  整數爲0,小數爲0.4
0.4*2 = 0.8  整數爲0,小數爲0.8
0.8*2 = 1.6  整數爲1,小數爲0.6
0.6*2 = 1.2  整數爲1,小數爲0.2
0.2*2 = 0.4  整數爲0,小數爲0.4
0.4*2 = 0.8  整數爲0,小數爲0.8
0.8*2 = 1.6  整數爲1,小數爲0.6
0.6*2 = 1.2  整數爲1,小數爲0.2
一直重複 ....

0.2 用二進制表示是 0.001100110011… ,你會發現 0.2 根本無法用二進制來精確表示。就像 1/3 沒法用小數精確表示同樣,只能取一個近似值。

若是把這個二進制小數 0.001100110011 轉換回10進制是:

0.001100110011 = 1*2^-3 + 1* 2^-4 + 1* 2^-7 + 1* 2^-8 + 1* 2^-11 + 1* 2^-12
= 1/8 + 1/16 +1/128 + 1/256 + 1/2048 + 1/4096
= 0.199951171875

這只是一個接近 0.2 的數,精度越高就越靠近 0.2, 但永遠不可能等於0.2。那麼在計算機內部,浮點數到底怎麼存儲的呢?

根據國際標準IEEE 754,一個二進制浮點數 V 分爲3部分,能夠用下面這個公式來表示:

  • s表示符號位,當s=0,V爲正數;

    當s=1,V爲負數

  • M表示有效數字, 1<=M<2

  • E表示指數位

例如十進制1.25,寫成二進制是1.01,用該公式表示至關於 1.01×2^0。能夠得出s=0,M=1.01,E=0。

IEEE 754規定

一、對於32位的浮點數,最高位是符號位s,接着的8位是指數E,剩下的23位爲有效數字M。

二、對於64位的浮點數,最高的1位是符號位S,接着的11位是指數E,剩下的52位爲有效數字M

三、M的第一位老是1,會被捨去,好比保存1.01的時候,實際上只保存小數點後面的01部分

四、E的真實值必須再減去一箇中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。

基於以上規則,咱們能夠對浮點數進行驗證,能夠用下面這個函數查看一個浮點數在計算機中實際存儲的值:

import struct
def float_to_bits(f):
s = struct.pack('>f', f)
return struct.unpack('>l', s)[0]

>>>print(float_to_bits(0.2))
1045220557
print(bin(float_to_bits(0.2)))
0b111110010011001100110011001101

浮點數 0.2 實際存儲的值是 1045220557,對應的二進制是 111110010011001100110011001101,轉換成32位整數還要在前面補2個0,最後變成:

0 01111100 10011001100110011001101

最高位爲0,因此表示正數,接着8位 01111100 是指數位E,對應整數是124,根據IEEE 754規定,E的真實值要減去127,因此E=-3,最後23爲是M的值,由於前面省略了一位,因此M的真實值是:

1.10011001100110011001101

最後V的值就是:

1.10011001100110011001101*2^-3=0.00110011001100110011001101=1/8 + 1/16 +1/128 + 1/256 + 1/2048 + 1/4096 + ...=0.20000000298023224

它的實際值比 0.2 要大一點點,因此纔看到了最開始的那一幕。

推薦一下個人Python的學習裙【 784758214 】,不管你是大牛仍是小白,是想轉行仍是想入行均可以來了解一塊兒進步一塊兒學習!裙內有開發工具,不少乾貨和技術資料分享!但願新手少走彎路

  不要太過急功近利, 慢慢玩, 精進.

  若是你覺着編程有趣, 成長也就再也不痛苦, 祝學習愉快.

相關文章
相關標籤/搜索