浮點數二進制表示

在討論浮點數以前,先看一下整數在計算機內部是怎樣表示的。class

  int num=9;變量

上面這條命令,聲明瞭一個整數變量,類型爲int,值爲9(二進制寫法爲1001)。普通的32位計算機,用4個字節表示int變量,因此9就被保存爲00000000 00000000 00000000 00001001,寫成16進制就是0x00000009。二進制

那麼,咱們的問題就簡化成:爲何0x00000009還原成浮點數,就成了0.000000?im

下面一步一步的揭曉答案。img

先來看一個公式,計算浮點數的公式:計算機

根據國際標準IEEE 754,任意一個二進制浮點數V能夠表示成下面的形式:block

  

  (1)(-1)^s表示符號位,當s=0,V爲正數;當s=1,V爲負數。浮點數

  (2)M表示有效數字,大於等於1,小於2。數字

  (3)2^E表示指數位。

舉例來講,十進制的5.0,寫成二進制是101.0,至關於1.01×2^2。那麼,按照上面V的格式,能夠得出s=0,M=1.01,E=2。

十進制的-5.0,寫成二進制是-101.0,至關於-1.01×2^2。那麼,s=1,M=1.01,E=2。

IEEE 754規定,對於32位的浮點數,最高的1位是符號位s,接着的8位是指數E,剩下的23位爲有效數字M。

對於64位的浮點數,最高的1位是符號位S,接着的11位是指數E,剩下的52位爲有效數字M。

 

IEEE 754對有效數字M和指數E,還有一些特別規定。

前面說過,1≤M<2,也就是說,M能夠寫成1.xxxxxx的形式,其中xxxxxx表示小數部分。IEEE 754規定,在計算機內部保存M時,默認這個數的第一位老是1,所以能夠被捨去,只保存後面的xxxxxx部分。好比保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣作的目的,是節省1位有效數字。以32位浮點數爲例,留給M只有23位,將第一位的1捨去之後,等於能夠保存24位有效數字。

至於指數E,狀況就比較複雜。

首先,E爲一個無符號整數(unsigned int)。這意味着,若是E爲8位,它的取值範圍爲0~255;若是E爲11位,它的取值範圍爲0~2047。可是,咱們知道,科學計數法中的E是能夠出現負數的,因此IEEE 754規定,E的真實值必須再減去一箇中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。

好比,2^10的E是10,因此保存成32位浮點數時,必須保存成10+127=137,即10001001。

而後,指數E還能夠再分紅三種狀況:

(1)E不全爲0或不全爲1。這時,浮點數就採用上面的規則表示,即指數E的計算值減去127(或1023),獲得真實值,再將有效數字M前加上第一位的1。

(2)E全爲0。這時,浮點數的指數E等於1-127(或者1-1023),有效數字M再也不加上第一位的1,而是還原爲0.xxxxxx的小數。這樣作是爲了表示±0,以及接近於0的很小的數字。

(3)E全爲1。這時,若是有效數字M全爲0,表示±無窮大(正負取決於符號位s);若是有效數字M不全爲0,表示這個數不是一個數(NaN)。

 

下面,讓咱們回到一開始的問題:爲何0x00000009還原成浮點數,就成了0.000000?

首先,將0x00000009拆分,獲得第一位符號位s=0,後面8位的指數E=00000000,最後23位的有效數字M=000 0000 0000 0000 0000 1001。

因爲指數E全爲0,因此符合上一節的第二種狀況。所以,浮點數V就寫成:

  V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

顯然,V是一個很小的接近於0的正數,因此用十進制小數表示就是0.000000。

相關文章
相關標籤/搜索