魔性的float浮點數精度問題

從一個問題引入

若是你之前接觸過C語言,那麼對下面的這段代碼必定很熟悉:ios

#include <stdio.h>

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        printf("f_num1 = %f\n", f_num1);
        printf("f_num2 = %f\n", f_num2);
        printf("f_num1 + f_num2 = %f\n", f_num1 + f_num2);

        return 0;
}

相信不少人不用運行,可以直接報出答案, f_num1 = 21.75, f_num2 = 13.45, f_num1 + f_num2 = 35.2,不管是從常識仍是理論角度都不難理解。
下面咱們運行一下程序,驗證咱們的猜想正不正確:編程

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

f_num1f_num2的結果和咱們預想的同樣,之因此後面多了四個0,是由於%f默認保留6位有效數字。可是f_num1 + f_num2的結果是什麼鬼,這個35.200001是從哪裏來的?
是否是一會兒顛覆了咱們的認知?
驚不驚喜,意不意外,刺不刺激?是否是發現自從學了C語言,連簡單的算術都不會算了?
別急,還有更令你崩潰的。bash

若是是C++呢

下面咱們看看以上程序的C++版本:spa

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;
        cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
        return 0;
}

直接來看輸出結果吧:code

f_num1 = 21.75
f_num2 = 13.45
f_num1 + f_num2 = 35.2

很神奇是否是?由於這個結果看起來正常多了。
看到這裏,相信咱們的內心都有老大一個疑問:爲何C程序和C++程序對一樣的數字處理,輸出的結果卻不同的?cout到底作了些什麼?內存

cout的神奇之處

爲了驗證cout對浮點數的處理,咱們不妨看一下下面的程序:編譯器

#include <iostream>
using namespace std;

int main(void)
{
        float num1 = 5;
        float num2 = 5.00;
        float num3 = 5.14;
        float num4 = 5.140000;
        float num5 = 5.123456;
        float num6 = 5.987654321;
        cout << "num1 = " << num1 << endl;
        cout << "num2 = " << num2 << endl;
        cout << "num3 = " << num3 << endl;
        cout << "num4 = " << num4 << endl;
        cout << "num5 = " << num5 << endl;
        cout << "num6 = " << num6 << endl;

        return 0;
}

看結果來分析比較直觀,運行以上程序,結果以下:io

num1 = 5
num2 = 5
num3 = 5.14
num4 = 5.14
num5 = 5.12346
num6 = 5.98765

num1num2num3num4這兩組結果能夠知道,cout對於float類型數值小數點後面的0是直接省去了的(這點和C語言格式化輸出的%g有點像)。
num5num6兩組結果不難分析出,cout對於浮點型數值,最多保留6位有效數字。
以上是cout處理浮點數時的特色,應該記住。
事實上,咱們使用iostream庫裏的cout.setf不難使cout恢復精度。咱們對上面的代碼修改以下:編譯

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout.setf(ios_base::fixed, ios_base::floatfield);       
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;
        cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
        return 0;
}

輸出的結果就與C語言版本如出一轍了:class

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

答案呼之欲出

文章寫到這裏,相信你已經看出來問題的所在了。
不錯,之因此結果不同,正是因爲精度引發的!
讓咱們回顧一下官方教材裏關於float精度的描述:

浮點型和表示單精度、雙精度和擴展精度值。 C++標準指定了一個浮點數有效位數的最小值,然而大多數編譯器都實現了更高的精度。 一般, float以一個字(32比特)來表示, double以2個字(64比特)來表示, long double 以3或4個字(96或128比特)來表示。通常來講,類型 floatdouble分別有7和16個有效位;類型 long double則經常被用於有特殊浮點需求的硬件,它的具體實現不一樣,精度也各不相同。( 《C++ Primer第五版》

由以上描述,咱們不難知道,對於float來講,最多隻有7個有效位,這也就意味着,當實際存儲的精度大於float的精度範圍時,就會出現精度丟失現象。
爲了進一步佐證上述問題,咱們不妨將float的數值放大10億倍,看看裏面存儲的值究竟是多少:

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout.setf(ios_base::fixed, ios_base::floatfield);
        int billion = 1E9;
        float f_num10 = f_num1 * billion;
        float f_num20 = f_num2 * billion;
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;

        cout << "f_num10 = " << f_num10 << endl;
        cout << "f_num20 = " << f_num20 << endl;
        return 0;
}

以上程序運行結果以下:

f_num1 = 21.750000
f_num2 = 13.450000
f_num10 = 21749999616.000000
f_num20 = 13449999360.000000

由此咱們不難推斷,21.75在實際存儲時,並非存儲的21.75,而是21.749999616,一樣的,12.45存儲的是12.449999360,這樣計算出來以後天然就會形成結果的不正確。

再看一個例子

咱們再來看一個精度丟失形成運算結果不正確的例子。

#include<iostream>
using namespace std;

int main(void)
{
        float num1 = 2.3410E23;
        float num2 = num1 + 1.0f;
        cout << "num2 - num1 = " << num2 - num1 << endl;
        return 0;
}

若是精度不丟失,運算結果應該爲1纔對,但是由於精度丟失,致使最後的加1實際和沒加效果同樣,計算出來的結果是0。

num2 - num1 = 0

怎麼解決

那麼,既然float有這麼多稀奇古怪的問題,應該怎麼去解決和避免呢?

首先,固然推薦你們在編程時儘可能使用高精度的浮點類型

好比double就比float精度要高,不少時候,使用double可以避免不少問題,好比本文一開始提到的問題,若是使用double就能完美解決:

#include <stdio.h>

int main(void)
{
        double f_num1 = 21.75;
        double f_num2 = 13.45;
        printf("f_num1 = %lf\n", f_num1);
        printf("f_num2 = %lf\n", f_num2);
        printf("f_num1 + f_num2 = %lf\n", f_num1 + f_num2);

        return 0;
}

你們能夠本身運行一下看看結果。
double類型能夠解決大部分精度丟失問題,基本上知足平常使用了,可是仍然不能避免精度丟失(double也有精度限制),這時候就須要想另外的方法來解決了。

萬能的cout

前面提到過,cout實際上是能夠解決這種精度丟失問題的,因此若是不是對效率要求太高或者要求格式化輸出(其實cout也能夠實現格式化輸出,此處不詳細展開)必須使用printf,在編寫C++程序時,建議使用cout代替printf

寫在最後

本文只是簡單的介紹了一下浮點型數值的精度問題,若是要深刻細究,確定不止這麼多內容,好比浮點型數值在內存中是如何存儲的?在字節裏是如何分佈 的?這纔是真正核心的原理部分。在這裏只淺嘗輒止地講述了一下,但相信閱讀者已經對精度問題有了一個初步的認識。

相關文章
相關標籤/搜索