只有1%的Python 程序員搞懂過浮點數陷阱

時間 2019-12-04

原文原文鏈接

容純乾貨，先從一個例子提及算法

>>> 0.1+0.2==0.3
False

當你第一次看到這個結果時可能會很是驚訝，原來還有個這麼大的bug，再來看看錶達式 0.1+0.2 到底等於多少？編程

>>> 0.1+0.2
0.30000000000000004

徹底超出咱們的想象。那麼這個操做在計算機裏面到底發生了什麼事情？函數

咱們仍是回到二進制。工具

首先，須要明確一點，在計算機中不管是整數、浮點數、仍是字符串最終都是用二進制來表示的。學習

整數的二進制表示法

整數 9 在計算機中二進制表示是： 1001 ，怎麼得來的？開發工具

用十進制整數整除以2，獲得商和餘數，該餘數就是二進制數的最低位，而後繼續用商整除以2，獲得新的商和餘數，以此類推，直到商等於0，由全部餘數倒排組成了該整數的二進制表現形式。用代碼表示是：code

>>> n = 9
>>> while n >0:
    n,e = divmod(n, 2) # divmod返回n除以2的商和餘數
    print(e)
1 # 低位
0
0
1 # 高位

二進制轉化爲十進制整數

咱們知道，十進制用科學計算法可表示爲：開發

123 = 1*10^2 + 2*10^1 + 3*10^0 
= 100 + 20 + 3 
= 123

一樣的道理，若是是二進制數，可表示：字符串

1001 = 1*2^3 + 0*2^2 +0*2^1 + 1*2^0
= 8+0+0+1 
= 9

再來看浮點數it

浮點數的二進制表示法

二進制小數和二進制整數沒什麼區別，都是由0和1組成，只是多了一個點，例如：101.11 就是一個二進制小數，對應的十進制數是：

101.11 = 1*2^2 + 0*2^1 + 1*2^0 + 1*2^-1 + 1* 2^-2
= 4 + 0 + 1 + 1/2 + 1/4
= 5 + 0.5 + 0.25
= 5.75

小數點左邊用 2^n 表示，小數點右邊的值用 2^-n來表示。

浮點數轉換成二進制小數

十進制的浮點數轉換成二進制小數的步驟：

小數點前面的整數部分按照十進制轉二進制的方式操做
小數部分乘以2，取整數0或者1，剩下的小數繼續乘2一直重複，直到小數部分爲0或達到指定的精度爲止

例如 2.25 轉換成二進制小數,整數2轉換爲二進制是 10，小數部分0.25轉換二進制是：

0.25 * 2 = 0.5  整數爲0，小數爲0.5
0.5 * 2 = 1.0   整數爲1，小數爲0

因此 2.25 表示成二進制小數是 10.01 ，但並非每個浮點數都這麼幸運最後乘2小數爲0的，好比 0.2 轉換成二進制是：

0.2*2 = 0.4  整數爲0，小數爲0.4
0.4*2 = 0.8  整數爲0，小數爲0.8
0.8*2 = 1.6  整數爲1，小數爲0.6
0.6*2 = 1.2  整數爲1，小數爲0.2
0.2*2 = 0.4  整數爲0，小數爲0.4
0.4*2 = 0.8  整數爲0，小數爲0.8
0.8*2 = 1.6  整數爲1，小數爲0.6
0.6*2 = 1.2  整數爲1，小數爲0.2
一直重複 ....

0.2 用二進制表示是 0.001100110011… ，你會發現 0.2 根本無法用二進制來精確表示。就像 1/3 沒法用小數精確表示同樣，只能取一個近似值。

若是把這個二進制小數 0.001100110011 轉換回10進制是：

0.001100110011 = 1*2^-3 + 1* 2^-4 + 1* 2^-7 + 1* 2^-8 + 1* 2^-11 + 1* 2^-12
= 1/8 + 1/16 +1/128 + 1/256 + 1/2048 + 1/4096
= 0.199951171875

這只是一個接近 0.2 的數，精度越高就越靠近 0.2，但永遠不可能等於0.2。那麼在計算機內部，浮點數到底怎麼存儲的呢？

根據國際標準IEEE 754，一個二進制浮點數 V 分爲3部分，能夠用下面這個公式來表示：

s表示符號位，當s=0，V爲正數；

當s=1，V爲負數
M表示有效數字， 1<=M<2
E表示指數位

例如十進制1.25，寫成二進制是1.01，用該公式表示至關於 1.01×2^0。能夠得出s=0，M=1.01，E=0。

IEEE 754規定

一、對於32位的浮點數，最高位是符號位s，接着的8位是指數E，剩下的23位爲有效數字M。

二、對於64位的浮點數，最高的1位是符號位S，接着的11位是指數E，剩下的52位爲有效數字M

三、M的第一位老是1，會被捨去，好比保存1.01的時候，實際上只保存小數點後面的01部分

四、E的真實值必須再減去一箇中間數，對於8位的E，這個中間數是127；對於11位的E，這個中間數是1023。

基於以上規則，咱們能夠對浮點數進行驗證，能夠用下面這個函數查看一個浮點數在計算機中實際存儲的值：

import struct
def float_to_bits(f):
s = struct.pack('>f', f)
return struct.unpack('>l', s)[0]

>>>print(float_to_bits(0.2))
1045220557
print(bin(float_to_bits(0.2)))
0b111110010011001100110011001101

浮點數 0.2 實際存儲的值是 1045220557，對應的二進制是 111110010011001100110011001101，轉換成32位整數還要在前面補2個0，最後變成：

0 01111100 10011001100110011001101

最高位爲0，因此表示正數，接着8位 01111100 是指數位E，對應整數是124，根據IEEE 754規定，E的真實值要減去127，因此E=-3，最後23爲是M的值，由於前面省略了一位，因此M的真實值是：

1.10011001100110011001101

最後V的值就是：

1.10011001100110011001101*2^-3=0.00110011001100110011001101=1/8 + 1/16 +1/128 + 1/256 + 1/2048 + 1/4096 + ...=0.20000000298023224

它的實際值比 0.2 要大一點點，因此纔看到了最開始的那一幕。

推薦一下個人Python的學習裙【 784758214 】，不管你是大牛仍是小白，是想轉行仍是想入行均可以來了解一塊兒進步一塊兒學習！裙內有開發工具，不少乾貨和技術資料分享！但願新手少走彎路

　　不要太過急功近利, 慢慢玩, 精進.

　　若是你覺着編程有趣, 成長也就再也不痛苦, 祝學習愉快.

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。