深刻理解計算機系統(第三版)做業題答案(第二章)

時間 2019-11-06

標籤深刻理解計算機系統第三答案第二简体版

原文原文鏈接

說明

我發現，當把這些題作完以後對本章知識的理解纔算有點小進步。下邊的答案主要參考了這兩個網站：git

2.58

原理是把指向一個int類型的指針強行改成指向char類型，通常來講一個char佔8位，這就能判斷出來取出的值是否大於1github

int is_little_endian(){
    int a = 1;
    return *((char*)&a);
}

2.59

這個比較簡單，主要考察如何獲取某些位。app

(x&0xFF) | (y&~0xFF)

2.60

i << 3表示i * 2^3, 其原理是找出須要替換的那些位，而後將其替換掉就好了。less

unsigned replace_byte(unsigned x, unsigned char b, int i)
{
    return (x & ~(0xFF<<(i<<3))) | (b << (i<<3));
}

位級整數編碼規則

2.61

下邊的內容跟書的題目有關係，須要根據實際狀況。dom

A(!~x) // 比較簡單，不解釋
B(!x) // 同上
C(!~(x | (~0xFF))) // x的最低有效字節中的位都等於1
D(!(x >> ((sizeof(int) - 1) << 3))) // x的最高有效字節中的位都等於0

2.62

這個題我以爲在使用補碼錶示整數的機器上是沒啥問題的ide

#include <stdio.h>

int int_shifts_are_arithmetic() {
    int i = -1;
    return (i >> 1) == -1;
}

int main(void) {
    printf("%d", int_shifts_are_arithmetic());
}

2.63

#include <stdio.h>

unsigned srl(unsigned x, int k) {
    int xsrl = (int)x >> k;
    int w = 8 * sizeof(int);

    unsigned z = 2 << (w - k -1);
    return (z - 1) & xsrl;
}

int sra(int x, int k) {
    int xsra = (unsigned)x >> k;
    int w = sizeof(int) << 3;

    unsigned z = 1 << (w - k - 1);
    unsigned mask = z - 1;

    unsigned right = xsra & mask;
    unsigned left = ~mask & (~(z & xsra) + z);

    return left | right;
}

int main(void) {
    unsigned t1 = srl(100, 2);
    unsigned t2 = (unsigned)100 >> 2;
    printf("%d----%d \n", t1, t2);

    int t3 = sra(100, 2);
    int t4 = 100 >> 2;
    printf("%d----%d \n", t3, t4);

    int t5 = sra(-100, 2);
    int t6 = -100 >> 2;
    printf("%d----%d \n", t5, t6);
}

2.64

// 該題目要求，只要奇數位有1，就返回1，不然返回0

#include <stdio.h>
/* Return 1 when any odd bit of x equals 1, 0 otherwise.
   Assume w = 32.
*/
int any_odd_one(unsigned x) {
    return !!(x & 0x55555555);
}

int main(void) {
    int result = any_odd_one((unsigned)5);
    printf("The result of 5: %d \n", result);

    int result1 = any_odd_one((unsigned)2);
    printf("The result of 2: %d \n", result1);
}

2.65

// 該題目要求，只要二進制書中1的個數爲奇數，就返回1，不然返回0


#include <stdio.h>
/* Return 1 when x contains an odd nuimber of 1s, 0 otherwise.
   Assume w = 32.
*/
int odd_ones(unsigned x) {
    // 這是第一層的處理，對某一位i而言，經過右移了一位，咱們就獲取到了i前邊的那一位，把他們異或後，
    // 獲得的位的值爲0或者1，1就表示和前邊的一位中有奇數個1，0表示有偶數個1.
    x ^= (x >> 1);

    // 通過上邊的處理後呢，x中每一位的值的意義就不一樣了，他表示該位和它前邊的位1的個數是奇數仍是偶數
    //  此時咱們再右移2位，就得到了i前邊的前邊的值j，這個值j表示j和前邊一位1的個數是奇數仍是偶數
    //  異或後，的值就即是到j前邊，一共四位1的個數是奇數仍是偶數
    x ^= (x >> 2);

    // 後面的都是按照上邊的原理依次類推的

    x ^= (x >> 4);
    x ^= (x >> 8);
    x ^= (x >> 16);
    return x & 1;
}

int main(void) {
    int result = odd_ones((unsigned)5);
    printf("The result of 5: %d \n", result);

    int result1 = odd_ones((unsigned)7);
    printf("The result of 3: %d \n", result1);
}

2.66

#include <stdio.h>
#include <assert.h>

// 1. 先使用或加位移讓第一個1的後邊都是1
// 2. 而後取非後右移一位後，最右邊的1就是咱們想要的掩碼
// 3. 因爲上邊獲得的那個1就是原值中的第一個1的位置，所以&上原值就清空了1前邊的位
int leftmost_one(unsigned x) {
    x |= x >> 1;
    x |= x >> 2;
    x |= x >> 4;
    x |= x >> 8;
    x |= x >> 16;

    return x & (~x >> 1);
}

int main(void) {
    assert(leftmost_one(0xff00) == 0x8000);
    assert(leftmost_one(0x6600) == 0x4000);
    return 0;
}

2.67

#include <stdio.h>
#include <assert.h>

int int_size_is_32() {
    int set_msb = 1 << 31;
    int beyond_msb = set_msb << 1;

    return set_msb && !beyond_msb;
}

int int_size_is_32_for_16bit() {
    int set_msb = 1 << 15 << 15 << 1;
    int beyond_msb = set_msb << 1;

    return set_msb && !beyond_msb;
}

int main(void) {
    printf("1: %lu \n", sizeof(1));
    printf("32: %d \n", int_size_is_32());
    printf("16: %d \n", int_size_is_32_for_16bit());
}

2.68

#include <stdio.h>
#include <assert.h>

int lower_one_mask(int n) {
    int w = sizeof(int) << 3;
    return (unsigned)-1 >> (w - n);
}

int main(void) {
    assert(lower_one_mask(6) == 0x3F);
    assert(lower_one_mask(17) == 0x1FFFF);
    assert(lower_one_mask(32) == 0xFFFFFFFF);
    return 0;
}

2.69

#include <stdio.h>
#include <assert.h>

unsigned rotate_left(unsigned x, int n) {
    int w = sizeof(int) << 3;
    unsigned t = x << n;
    unsigned t1 = x >> (w - n - 1) >> 1;
    return t | t1;
}

int main(void) {
    assert(rotate_left(0x12345678, 4) == 0x23456781);
    assert(rotate_left(0x12345678, 20) == 0x67812345);
    assert(rotate_left(0x12345678, 0) == 0x12345678);
    return 0;
}

2.70

#include <stdio.h>
#include <assert.h>

// 若是x的二進制能夠用n位表示就返回1，
/*
   * Assume w = 8, n = 3
   * if x > 0
   *   0b00000110 is ok, 0b00001010 is not
   *   first w-n bits must be 0
   * if x < 0
   *   0b11111100 is ok, 0b10111100 is not, and 0b11111000 is not yet
   *   first w-n+1 bits must be 1
   */
int fits_bits(int x, int n) {
    int w = sizeof(int) << 3;
    x >>= n - 1;

    /*
     * !(x >> 1) 用於判斷x大於0的狀況
     * !~x 用於判斷x小於0的狀況
     */
    return !(x >> 1) || !~x;
}

int main(void) {
    assert(fits_bits(0xFF, 8));
    assert(!fits_bits(0xFFFFFF00, 8));
    return 0;
}

2.71

#include <stdio.h>
#include <assert.h>

typedef unsigned packet_t;

// 該函數的做用是取出一個字中的某個字節，而後把該字節擴展爲有符號整數
// 難點在於如何利用算數右移填充前邊的位
// 核心思想就是先把目前字節左移到最高位，而後再利用算數右移
int xbyte(packet_t word, int bytenum) {
    int size = sizeof(unsigned);
    int shift_left_val = (size - 1 - bytenum) << 3;
    int shift_right_val = (size - 1) << 3;
    return (int)word << shift_left_val >> shift_right_val;
}

int main(void) {
    assert(xbyte(0xAABBCCDD, 1) == 0xFFFFFFCC);
    assert(xbyte(0x00112233, 2) == 0x11);
    return 0;
}

2.72

#include <stdio.h>
#include <assert.h>
#include <stdlib.h>
#include <string.h>

void copy_int(int val, void *buf, int maxbytes) {
    if (maxbytes >= (int)sizeof(val)) {
        memcpy(buf, (void *)&val, sizeof(val));
    }
}

int main() {
    int maxbytes = sizeof(int) * 10;
    void *buf = malloc(maxbytes);
    int val;

    val = 0x12345678;
    copy_int(val, buf, maxbytes);
    assert(*(int *)buf == val);
        val = 0x11111111;

    val = 0xAABBCCDD;
    copy_int(val, buf, 0);
    assert(*(int *)buf != val);

    return 0;
}

2.73

#include <stdio.h>
#include <assert.h>
#include <limits.h>

// 該函數是飽和加法，當正溢出，取最大整數，負溢出，取最小整數
int saturationg_add(int x, int y) {
    int sum = x + y;
    int sig_mask = INT_MIN;

    // 若是x > 0 y > 0 sum < 0 正溢出
    // 若是x < 0 y < 0 sum > 0 負溢出
    int pos_over = !(x & sig_mask) && !(y & sig_mask) && (sum & sig_mask);
    int neg_over = (x & sig_mask) && (y & sig_mask) && !(sum & sig_mask);

    (pos_over && (sum = INT_MAX)) || (neg_over && (sum = INT_MIN));

    return sum;
}


int main() {
    assert(INT_MAX == saturationg_add(INT_MAX, 0x1234));
    assert(INT_MIN == saturationg_add(INT_MIN, -0x1234));
    assert(0x12 + 0x34 == saturationg_add(0x12, 0x34));

    return 0;
}

2.74

#include <stdio.h>
#include <assert.h>
#include <limits.h>

// 該函數用於檢查兩個整數相減會不會產生溢出
// 這個和上邊的題目很類似，能夠把x-y看作x+（-y）
int tsub_ok(int x, int y) {
    // 當y爲最小整數的時候，就產生了溢出，由於任何數減最小數都會溢出
    if (y == INT_MIN) {
        return 0;
    }

    int neg_y = -y;
    int sum = x + neg_y;
    int pos_over = x > 0 && neg_y > 0 && sum < 0;
    int neg_over = x < 0 && neg_y < 0 && sum >= 0;

    return !(pos_over || neg_over);
}


int main(int argc, char* argv[]) {
  assert(!tsub_ok(0x00, INT_MIN));
  assert(tsub_ok(0x00, 0x00));
  return 0;
}

2.75

/*
    這個問題須要一步一步的進行推導
    T2Uw(x)咱們把這種寫法稱爲補碼轉無符號數，那麼很容易得出：
    (2^w表示2的w次方，爲何當x<0時是這個結果呢，
    其實，補碼的負數就是把原來w-1以後的位的結果減去了最高一位的值，最高位的值就是2^w)
    if x < 0  => x + 2^w
    if x > 0  => x

    上邊的公式很簡單，但在使用的時候還要作判斷，顯然很不科學，咱們能夠認爲T2Uw(x)是一個函數
    接下來就想辦法推導出一個表達式來

    這裏省略了一系列的推導過程，得出了這樣一個結果"
    T2Uw(X)= X + X(w-1)2^w

    你們看看這個式子跟上邊的那個做用同樣，x的w-1位就是他的最高位，若是該位的值是1，那麼就至關於
    x<0的狀況，不然就是另外一種狀況

    咱們假設x`表示x的無符號值
    X` = X + X(w-1)2^w

    咱們假設y`表示x的無符號值
    Y` = Y + Y(w-1)2^w

    那麼X` * Y` = (X + X(w-1)2^w) * (Y + Y(w-1)2^w)
    若是要把這個計算式展開會很麻煩，咱們能夠進一步抽象
    設a = X(w-1)2^w, b= Y(w-1)2^w
    則： X` * Y` = X*Y + X*b + Y*a + a*b

    咱們假定有這樣一個函數，他的功能是取出無符號數的最高位uh(),所以上邊的式子變形爲：
    uh(X` * Y`) = uh(X*Y + X*b + Y*a + a*b)
                = uh(X*Y) + uh(X*b) + uh(Y*a) + uh(a*b)

    那麼X * b 也就是X*b= X*Y(w-1)2^w 他的最高位的值就是X*Y(w-1)2^w / 2^w => X*Y(w-1)
    那麼Y * a 也就是Y*a= Y*X(w-1)2^w 他的最高位的值就是Y*X(w-1)2^w / 2^w => Y*X(w-1)
    那麼a * b 也就是a*b= X(w-1)2^w * Y(w-1)2^w 他 / 2^w => 0

    ===> uh(X` * Y`) = uh(X*Y) + X*Y(w-1) + Y*X(w-1)

    上邊推理的核心思想就是 無符號X`的補碼錶示：X + X(w-1)2^w 求高位的/ 2^w 操做
*/

/*
 * unsigned-high-prod.c
 */
#include <stdio.h>
#include <assert.h>
#include <inttypes.h>

int signed_high_prod(int x, int y) {
  int64_t mul = (int64_t) x * y;
  return mul >> 32;
}

unsigned unsigned_high_prod(unsigned x, unsigned y) {
  /* TODO calculations */
  int sig_x = x >> 31;
  int sig_y = y >> 31;
  int signed_prod = signed_high_prod(x, y);
  return signed_prod + x * sig_y + y * sig_x;
}

/* a theorically correct version to test unsigned_high_prod func */
unsigned another_unsigned_high_prod(unsigned x, unsigned y) {
  uint64_t mul = (uint64_t) x * y;
  return mul >> 32;
}

int main(int argc, char* argv[]) {
  unsigned x = 0x12345678;
  unsigned y = 0xFFFFFFFF;

  assert(another_unsigned_high_prod(x, y) == unsigned_high_prod(x, y));
  return 0;
}

2.76

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <assert.h>
#include <string.h>

void *another_calloc(size_t nmemb, size_t size) {
    if (nmemb == 0 || size == 0) {
        return NULL;
    }

    size_t buff_size = nmemb * size;
    if (nmemb == buff_size / size) {
        void *ptr = malloc(buff_size);
        memset(ptr, 0, buff_size);
        return ptr;
    }

    return NULL;
}


int main() {
    void *p;
    p = another_calloc(0x1234, 1);
    assert(p != NULL);
    free(p);

    p = another_calloc(SIZE_MAX, 2);
    assert(p == NULL);
    free(p);

    return 0;
}

2.77

#include <stdio.h>
#include <assert.h>

// K = 17
int A(int x) {
    return (x << 4) + x;
}

// K = -7
int B(int x) {
    return x - (x << 3);
}

// K = 60
int C(int x) {
    return (x << 6) - (x << 2);
}

// K = -112
int D(int x) {
    return (x << 4) - (x << 7);
}

int main() {
    int x = 0x12345678;

    assert(A(x) == x * 17);
    assert(B(x) == x * -7);
    assert(C(x) == x * 60);
    assert(D(x) == x * -112);

    printf("Passed.\n");
    return 0;
}

2.78

#include <stdio.h>
#include <assert.h>
#include <limits.h>

// c語言的除法要求向0取整，除法本質上就是右移操做
int divide_power2(int x, int k) {
    int is_neg = x & INT_MIN;
    (is_neg && (x = x + (1 << k) - 1));
    return x >> k;
}

int main(int argc, char* argv[]) {
  int x = 0x80000007;
  assert(divide_power2(x, 1) == x / 2);
  assert(divide_power2(x, 2) == x / 4);

  printf("%d", x);
  return 0;
}

2.79

#include <stdio.h>
#include <limits.h>
#include <assert.h>

/*
 * 在這個題目中的除以4中咱們須要注意的是取整問題，所以須要用到題目2.78的函數
 */

int divide_power2(int x, int k) {
    int is_neg = x & INT_MIN;
    (is_neg && (x = x + (1 << k) -1));
    return x >> k;
}

int mul3div4(int x) {
    int mul3 = (x << 1) + x;
    return divide_power2(mul3, 2);
}


int main() {
    int t = 0x12345678;
    assert(mul3div4(t) == (t * 3 / 4));
    return 0;
}

2.80

#include <stdio.h>
#include <assert.h>
#include <limits.h>

/*
 * 這個題目很是有意思，要保證不溢出，就要先作除法，也就是先除以4再乘以3
 * 在下邊中用到了一個很是巧妙的地方，把一個整數進行拆分
 */

/*
 * calculate 3/4x, no overflow, round to zero
 *
 * no overflow means divide 4 first, then multiple 3, diffrent from 2.79 here
 *
 * rounding to zero is a little complicated.
 * every int x, equals f(first 30 bit number) plus l(last 2 bit number)
 *
 *   f = x & ~0x3
 *   l = x & 0x3
 *   x = f + l
 *   threeforths(x) = f/4*3 + l*3/4
 *
 * f doesn't care about round at all, we just care about rounding from l*3/4
 *
 *   lm3 = (l << 1) + l
 *
 * when x > 0, rounding to zero is easy
 *
 *   lm3d4 = lm3 >> 2
 *
 * when x < 0, rounding to zero acts like divide_power2 in 2.78
 *
 *   bias = 0x3    // (1 << 2) - 1
 *   lm3d4 = (lm3 + bias) >> 2
 */

int threeforths(int x) {
  int is_neg = x & INT_MIN;

  int f = x & ~0x3;
  int l = x & 0x3;

  int fd4 = f >> 2;
  int fd4m3 = (fd4 << 1) + fd4;

  int lm3 = (l << 1) + l;
  int bias = (1 << 1) + 1;
  (is_neg && (lm3 += bias));
  int lm3d4 = lm3 >> 2;

  return fd4m3 + lm3d4;
}

int main(int argc, char* argv[]) {
  assert(threeforths(8) == 6);
  assert(threeforths(9) == 6);
  assert(threeforths(10) == 7);
  assert(threeforths(11) == 8);
  assert(threeforths(12) == 9);

  assert(threeforths(-8) == -6);
  assert(threeforths(-9) == -6);
  assert(threeforths(-10) == -7);
  assert(threeforths(-11) == -8);
  assert(threeforths(-12) == -9);
  return 0;
}

2.81

#include <stdio.h>
#include <assert.h>
#include <limits.h>

int A(int k) {
    return -1 << k;
}

int B(int k, int j) {
    return ~A(k) << j;
}


int main(int argc, char* argv[]) {
  assert(A(8) == 0xFFFFFF00);
  assert(B(16, 8) == 0x00FFFF00);

  printf("%d", -INT_MIN);
  return 0;
}

2.82

/*
 * 2.82.c
 */
#include <stdio.h>
#include <assert.h>
#include <limits.h>
#include "lib/random.h"

// 強調的是這個推導的過程

/* broken when x is INT_MIN */
int A(int x, int y) {
  return (x < y) == (-x > -y);
}

/*
 * right
 *
 * ((x + y) << 4) + y - x
 *   =>
 * x << 4 - x + y << 4 + y
 *   =>
 * x*16 - x + y*16 + y
 *   whether overflow or not, =>
 * x*15 + y*17
 */
int B(int x, int y) {
  return ((x + y) << 4) + y - x == 17 * y + 15 * x;
}

/*
 * right
 *
 * ~x + ~y + 1
 *   =>
 * ~x + 1 + ~y + 1 - 1
 *   =>
 * -x + -y - 1
 *   =>
 * -(x + y) - 1
 *   =>
 * ~(x + y) + 1 - 1
 *   =>
 * ~(x + y)
 */
int C(int x, int y) {
  return ~x + ~y + 1 == ~(x + y);
}

/*
 * right
 *
 * (ux - uy) == -(unsigned) (y - x)
 *   =>
 * -(ux - uy) == (unsigned) (y - x)
 *   =>
 * (ux - uy) == (unsigned) (x - y)
 */
int D(int x, int y) {
  unsigned ux = (unsigned) x;
  unsigned uy = (unsigned) y;

  return (ux - uy) == -(unsigned) (y - x);
}

/*
 * right
 *
 * x >> 2 << 2
 *   =>
 * x & ~0x3
 *   =>
 * x - num(00/01/10/11)
 *   =>
 * ((x >> 2) << 2) <= x
 */
int E(int x, int y) {
  return ((x >> 2) << 2) <= x;
}

int main(int argc, char* argv[]) {
  init_seed();
  int x = random_int();
  int y = random_int();

  assert(!A(INT_MIN, 0));
  assert(B(x, y));
  assert(C(x, y));
  assert(D(x, y));
  assert(E(x, y));
  return 0;
}

2.83

/*
 * A:
 * 這個問題的關鍵是找到y，k 和整數x的關係
 * 咱們假設這個整數是x
 * 那麼x = 0.yyyyyyyy... 這個時候是沒法得出結果的，並無用到k
 * 那麼要想用到k，咱們把x左移k爲 x << k = y.yyyyyyyy...
 * 上邊的那個表達式中y.yyyyyyyyy... = Y + x
 * 所以得出 x << k = Y + x === > x << k - x = Y == > x = Y/(2^k - 1)


 * B:
 * y = 101  == > k=3 Y=5 x=5/7
 * y = 0110  == > k=4 Y=6 x=6/15
 * y = 010011  == > k=6 Y=19 x=19/63
 */

2.84

#include <stdio.h>
#include <assert.h>

unsigned f2u(float x) {
    return *(unsigned *)&x;
}

int float_le(float x, float y) {
    unsigned ux = f2u(x);
    unsigned uy = f2u(y);

    unsigned sx = ux >> 31;
    unsigned sy = uy >> 31;

    return sx == sy ? (sx == 0 ? ux <= uy : ux >= uy) : sx > sy;
}


int main() {
    assert(float_le(+0, -0));
    assert(float_le(0, 3));
    assert(float_le(-4.12, -0));
    assert(float_le(-4, 4));

    return 0;
}

2.85

A:
bias = 2^(k-1) - 1 =
v = 2^E + M

7.0 = 111.000 = 1.11000x2^2

E = 2 = e - bias ==>  e = E + bias = 2 + bias = 1 + 2^(k-1) ==> 0 1000...001 1100...


B:
可以描述的最大的奇整數的位應該是111111......
而浮點數表示爲1.111111...*2^n的樣式，小數點後邊應該有n個1 獲得這些，咱們就能計算出該浮點數的二進制表示
所以最大的奇整數位11111... 有n+1個1 也就是2^(n+1) - 1
E = n  ==> e = E + bias = n + bias
==> 0 n + bias 11111...

C:
要想獲得最小的規格數，M必須是1.00...的樣式 E = 1 - bias
V = 2^(1-bias) 取倒數 ==> V = 2^(bias-1) ==> E = bias - 1
e = bias + E ==> e = 2bias -1 = 2(2^(k-1) - 1) - 1 = 2^k -3
==> 0 1111...101 000000

2.86

第一行答案：
最小的正非規格化數，要知足一下幾個條件
1. 符號位爲1
2. 階碼位所有爲0
3. 單獨的整數位爲0
4. 小數位最後一位爲1，其餘都爲0
得出的結論是： 0 000..00(15位) 0 000..01(63位)

偏量bias = 2^(k-1) - 1 = 2^(15-1) - 1 = 2^14 - 1
E = 1 - bias = 1 - 2^14 + 1 = 2 - 2^14
V = M * 2^E = 2^(-63) * 2^(2 - 2^14) = 2^(-63 + 2 - 2^14) = 2^(-61-2^14)



第二行答案：
最小的正規格數，知足下邊幾個條件
1. 符號位爲0
2. 階碼位爲1
3. 按照該題目要求，單獨的整數位爲1
4. 小數位全是0
得出的結論是： 0 000..01(15位) 1 000..00(63位)

偏量bias = 2^(k-1) - 1 = 2^(15-1) - 1 = 2^14 - 1
E = e - bias = 1 - 2^14 + 1 = 2 - 2^14
V = M * 2^E = 1 * 2^(2 - 2^14)



第三行答案：
最大的規格數，知足下邊幾個條件
1. 符號位爲0
2. 階碼位全爲1
3. 按照該題目要求，單獨的整數位爲1
4. 小數位全是1
得出的結論是： 0 111..10(15位) 1 111..11(63位)

偏量bias = 2^(k-1) - 1
E = e - bias = 2^15 - 2 - bias
V = M * 2^E = M * 2^(2^15 - 2 - bias) = M * 2^(2^14 * 2 - 2 - bias)
= M * 2^(2bias - bias) = M * 2^bias
此時M = 1 + (1 - 2^-63) = 2 - 2^-63
得出最終的結果是：2^bias * (2 - 2^-63)

2.87

-0:
首先尾數M必須爲0
階碼能夠設置成00000 所以E = 1 - bias = 1 - 15 = -14
獲得的位模式爲：1 00000 0000000000 ==> 0x8000


最小的>2的值：
由M * 2^E ==> E = 1 M = 1.0000000001
E = e - bias ==> e = E + bias = 16 ==> e = 100000
M的值爲2^-10 + 1 = 1025/1024
獲得的位模式爲：0 10000 0000000001 ==> 0x4001
V = 1025/1024 * 2 = 1025/512


512:
M = 1 E = 9 = e - bias ==> e = 9 + 15 = 24 ==> 11000
獲得的位模式爲：0 11000 0000000000 ==> 0x6000


最大的非規格化數：
非規格化數表示階碼位都是0 E= 1 - bias = -14
M 1023/1024
獲得的位模式爲：0 00000 1111111111 ==> 0x03FF


-oo:
1 11111 0000000000 ==> 0xFC00


十六進制表示爲3BB0:
先把這個數展開：0011 1011 1011 0000 ==> 0 01110 1110110000
e = 14 E = e - bias = 14 - 15 = -1
M = 2^-1 + 2^-2 + 2^-3 + 2^-5 + 2^-6 = 59/64
V = M * 2^E = 59/64 * 2^-1 = 59/128

2.88

注意：若是是規格化的M = 1 + f 非規格化M = f

0 10110 101 :
A:
E = 22 - 15 = 7 V = (2^-1 + 2^-3 + 1) * 2^7 = 13 * 2^4
B:
經過觀察，咱們發現，先保持小數位不變，求階碼，若是不行，在改變小數位
所以B的 0 1110 1010 V = 13 * 2^4


1 00111 110：
A:
E = 7 - 15 = -8 (2^-1 + 2^-2 + 1) * 2^-8 = 7/4 * 2^-8 = -7/2^10
B:
1 0011 1110 ==> M = 1 + 2^-1 + 2^-2 + 2^-3 = 15/8
==> 2^E = (7/2^10) / (15/8)  = 7/15 / 2^7 約等於2^-1*2^-7 = 2^-8
咱們看看2^E的範圍 2^-6 ~ 2^14
因爲上邊計算的2^-8不在這個範圍中，所以須要調整階碼的值
先從最小的開始，設階碼爲2^-6 那麼 7/2^10 / 2^-6 = 7 / 16
==> (1/16 + 2/16 + 4/16) ==> (1/16 + 1/8 + 1/4)  ==> (2^-4 + 2^-3 + 2^-2)
所以B的 0 0000 0111


0 00000 101:
A:
E = 1 - 15 = -14  V = (2^-1 + 2^-3) * 2^-14 = 5 * 2^-3 * 2^-14 = 5 * 2^-17 = 5/2^17
假設使用101做爲尾數，那麼M = (2^-1 + 2^-3 + 1) = 13 * 2^-3
2^E = V/M = 5/2^17 / (13 * 2^-3) = 5/17 * 2^-17 * 2^3 = 5/17 * 2^-14 顯然你在範圍以內
先從最小的開始，設階碼爲2^-6 那麼 5/2^17 / 2^-6 = 5 * 2^-11 顯然B沒法表示這個小數值
取一個最近似的 0 0000 0000


1 11011 000：
A:
E = 27 - 15 = 12 V = 2^12 取-  得-2^12
B:
因爲這個值比較大，所以階碼取最大值1110 e = 14 E = e - 7 = 14 - 7 = 7 這樣才能計算M的最小值
M = 2^12 / 2^7 = 2^5
顯然M的值沒法表示，所以階碼咱們此次使用 1111 -oo
1 1111 0000

2.89

/*
 * 2.89.c
 */
#include <stdio.h>
#include <assert.h>
#include <limits.h>
#include "lib/random.h"

/*
 * most important thing is that all double number come from ints
 */

/* right */
int A(int x, double dx) {
  return (float)x == (float)dx;
}

/* wrong when y is INT_MIN */
int B(int x, double dx, int y, double dy) {
  return dx-dy == (double)(x-y);
}

/* right */
int C(double dx, double dy, double dz) {
  return (dx+dy)+dz == dx+(dy+dz);
}

/*
 * wrong
 *
 * FIXME I don't know what conditions cause false
 */
int D(double dx, double dy, double dz) {
  return (dx*dy)*dz == dx*(dy*dz);
}

/* wrong when dx != 0 and dz == 0 */
int E(double dx, double dz) {
  return dx/dx == dz/dz;
}

int main(int argc, char* argv[]) {
  init_seed();

  int x = random_int();
  int y = random_int();
  int z = random_int();
  double dx = (double)x;
  double dy = (double)y;
  double dz = (double)z;

  printf("%x %x %x\n", x, y, z);

  assert(A(x, dx));
  assert(!B(0, (double)(int)0, INT_MIN, (double)(int)INT_MIN));
  assert(C(dx, dy, dz));
  /* magic number, brute force attack */
  assert(!D((double)(int)0x64e73387, (double)(int)0xd31cb264, (double)(int)0xd22f1fcd));
  assert(!E(dx, (double)(int)0));
  return 0;
}

2.90

/*
 * fpwr2.c
 */
#include <stdio.h>
#include <assert.h>
#include <math.h>

float u2f(unsigned x) {
  return *(float*) &x;
}

/* 2^x */
float fpwr2(int x) {
  /* Result exponent and fraction */
  unsigned exp, frac;
  unsigned u;

/* 由於2^x 是大於0的，所以咱們首先要肯定浮點數可以表示的正非規格化數的最小值是
0 00000000 00000...001  ==> 2^-23 * 2^(1-bias) = 2^-23 * 2^(1-(2^7 - 1))
= 2^-23 * 2^(2-2^7)) = 2^(2 - 2^7 -23) = 2 - 128 - 23 = -149

*/
  if (x < 2-pow(2,7)-23) {
    /* too small. return 0.0 */
    exp = 0;
    frac = 0;
  } else if (x < 2-pow(2,7)) {
    /* Denormalized result */
    /* 求出最小的規格化數
0 00000001 00000...000
E = 1 - 2^7 + 1 = 2 - 2^7 = -126 */

    exp = 0;
    /* 這段代碼塊求的值應該是非規格化數範圍內的值
       根據 V = M * 2^E V = 2^x  ==> 2^x = M * 2^E
       frac = M = 2^x / 2^E
       E = 1 - bias = 2-2^7
       frac = 2^(x - (2 - 2^7)) 這個是frac的值，可是咱們如何得到它的位模式呢？
       咱們知道0 00000000 00000...001 最後邊這個1對應的值是2^-23 也就是說
       小數位的值和他的位模式有一個對應關係，咱們只要求出frac是最後這個1（2^-23）的多少
       倍，而後1 << 這個倍數就能夠了，這樣就獲得了frac的位模式
     */
    frac = 1 << (unsigned)(x - (2-pow(2,7)-23));
  } else if (x < pow(2,7)-1+1) {
    /* Normalized result */
    /* 11111111 2^8 -1 - (2^7 - 1) ==> 2^8 - 2^7 -1 + 1 ==> 2^7
       所以求exp 就等於求e e = E + bias = x + (2^7 - 1)
     */
    exp = pow(2,7)-1+x;
    frac = 0;
  } else {
    /* Too big, return +oo */
    exp = 0xFF;
    frac = 0;
  }

  /* pack exp and frac into 32 bits */
  u = exp << 23 | frac;
  /* Result as float */
  return u2f(u);
}

int main(int argc, char* argv[]) {
  assert(fpwr2(0) == powf(2,0));
  assert(fpwr2(100) == powf(2,100));
  assert(fpwr2(-100) == powf(2,-100));
  assert(fpwr2(10000) == powf(2,10000));
  assert(fpwr2(-10000) == powf(2,-10000));
  return 0;
}

2.91

A:
0x40490FDB 展開後 0100 0000 0100 1001 0000 1111 1101 1011
換成小數的位模式： 0 10000000 10010010000111111011011

因爲2^E = 2 V = 2M  咱們知道M = 1.10010010000111111011011 那麼2m
就至關於 << 1 獲得：11.0010010000111111011011

B:
在問題2.83中咱們得出這麼一個公式：x = Y/(2^k - 1)
在本題中 x = 1/7 也就是說Y = 1 k = 3 說明Y是3位且值爲1 所以就是001
因此最終的答案是11.001001001...(001)

C:
十進制小數轉二進制數：「乘以2取整，順序排列」（乘2取整法）
223/71 = 3.140845070422535 小數部分：0.140845070422535
0.140845070422535 * 2 = 0.28169014084507  ----- 取整 ----- 0
0.28169014084507 * 2 = 0.563380281690141  ----- 取整 ----- 0
0.563380281690141 * 2 = 1.126760563380282  ----- 取整 ----- 1
0.126760563380282 * 2 = 0.253521126760563  ----- 取整 ----- 0
0.253521 * 2 = 0.507042  ----- 取整 ----- 0
0.507042 * 2 = 1.014084  ----- 取整 ----- 1
0.014084 * 2 = 0.028168  ----- 取整 ----- 0
0.028168 * 2 = 0.056336  ----- 取整 ----- 0
0.056336 * 2 = 0.112672  ----- 取整 ----- 0
0.112672 * 2 = 0.225344  ----- 取整 ----- 0
所以在第9位就不一樣了

2.92

#include <stdio.h>
#include <assert.h>

typedef unsigned float_bits;

float_bits float_negate(float_bits f) {
    unsigned sig = f >> 31;
    unsigned exp = f >> 23 & 0xFF;
    unsigned frac = f & 0x7FFFFF;

    int is_nan = (exp == 0xFF && frac != 0);
    if (is_nan) {
        return f;
    }

    return ~sig << 31 | exp << 23 | frac;
}

int main() {
    printf("%u", float_negate(32.0));
    assert(float_negate(32.0) == -32.0);
    return 0;
}

2.93

#include <stdio.h>
#include <assert.h>

typedef unsigned float_bits;

float_bits float_absval(float_bits f) {
    unsigned exp = f >> 23 & 0xFF;
    unsigned frac = f & 0x7FFFFF;

    int is_nan = (exp == 0xFF && frac != 0);
    if (is_nan) {
        return f;
    }

    return 0 << 31 | exp << 23 | frac;
}

int main() {
    printf("%u\n", float_absval(32.0));
    return 0;
}

2.94

#include <stdio.h>
#include <assert.h>

typedef unsigned float_bits;

/*
 * 要想實現浮點數*2，能夠這麼考慮 V = M * 2^E
 * 當浮點數是規格數的時候，咱們只須要改變E就好了，E = e - bias ==> 至關於給e的值+1
 * 可是+1有個特殊狀況，要是e的位模式爲11111110 +1 就須要特殊處理
 * 若是是非規格數， 那麼 2^E就是固定的值，咱們只能改變M的大小，*2就至關於把小數位左移一位
 */

float_bits float_twice(float_bits f) {
    unsigned sig = f >> 31;
    unsigned exp = f >> 23 & 0xFF;
    unsigned frac = f & 0x7FFFFF;

    int is_nan_or_oo = (exp == 0xFF);
    if (is_nan_or_oo) {
        return f;
    }

    if (exp == 0) {
        frac <<= 1;
    } else if (exp == 0xFE) {
        exp = 0xFF;
        frac = 0;
    } else {
        exp += 1;
    }

    return sig << 31 | exp << 23 | frac;
}

int main() {
    printf("%u\n", float_twice(32.22));
    return 0;
}

2.95

/*
 * float-half.c
 */
#include <stdio.h>
#include <assert.h>

typedef unsigned float_bits;

float_bits float_half(float_bits f) {
  unsigned sig = f >> 31;
  unsigned rest = f & 0x7FFFFFFF;
  unsigned exp = f >> 23 & 0xFF;
  unsigned frac = f & 0x7FFFFF;

  int is_NAN_or_oo = (exp == 0xFF);
  if (is_NAN_or_oo) {
    return f;
  }

  /*
   * 這裏就用到了向偶數取整的知識，在下邊的註釋中描述的很詳細
   * 那麼如何理解取整呢，咱們假設這個被右移出去的位爲a，那麼a就有多是1或者0，若是是0，那麼咱們
     就不須要取整，若是是1，咱們能夠這麼想：1111.a 這個a若是是1，折算成小數就是0.5 所以是須要
     取整的，它前邊的那一位若是是0，表示已是偶數了，就捨棄a 若是是1，要向上取整，在未右移以前+1就能夠了
   */

  /*
   * round to even, we care about last 2 bits of frac
   *
   * 00 => 0 just >>1
   * 01 => 0 (round to even) just >>1
   * 10 => 1 just >>1
   * 11 => 1 + 1 (round to even) just >>1 and plus 1
   */
  int addition = (frac & 0x3) == 0x3;

  if (exp == 0) {
    /* Denormalized */
    frac >>= 1;
    frac += addition;
  } else if (exp == 1) {
    /* Normalized to denormalized */
    rest >>= 1;
    rest += addition;
    exp = rest >> 23 & 0xFF;
    frac = rest & 0x7FFFFF;
  } else {
    /* Normalized */
    exp -= 1;
  }

  return sig << 31 | exp << 23 | frac;
}

2.96

#include <stdio.h>
#include <assert.h>

/*
    咱們首先考慮做爲浮點數f能表示的最大的合法的整數是多少？
    V = M * 2^E E = e - bias 由這兩個公式可知E越大越好也就是e越大越好
    e ==> 11111110 不能是11111111，
    咱們再考慮一個範圍 0 <= f < 1 若是f在這個範圍中，那麼它的值就直接取0
    咱們要找出這個範圍的浮點位模式，0：0 00000000 00000000000000000000000
                              1：0 01111111 00000000000000000000000
    在上邊的這個空間的值直接取0就行

    那麼f能表示的最大的合法的規格數是 0 11111110 111111111111111111111111
    超過這個數的就成爲越界了

    若是在這個範圍內：
    E = exp - bias;

    咱們知道M的值的二進制小數是1.xxxxx... 可是下邊M的值明顯是作了<<23操做的，所以後邊就要用E- 23
    M = frac | 0x800000;
    f = M * 2^E 根據這個公式，向0取整

    if (E > 23) {
      num = M << (E - 23);
    } else {
      num = M >> (23 - E);
    }

 */


 /*
 * Compute (float) f
 * If conversion cause overflow or f is NaN, return 0x80000000
 */
int float_f2i(float_bits f) {
  unsigned sig = f >> 31;
  unsigned exp = f >> 23 & 0xFF;
  unsigned frac = f & 0x7FFFFF;
  unsigned bias = 0x7F;

  int num;
  unsigned E;
  unsigned M;

  /*
   * consider positive numbers
   *
   * 0 00000000 00000000000000000000000
   *   ===>
   * 0 01111111 00000000000000000000000
   *   0 <= f < 1
   * get integer 0
   *
   * 0 01111111 00000000000000000000000
   *   ===>
   * 0 (01111111+31) 00000000000000000000000
   *   1 <= f < 2^31
   * integer round to 0
   *
   * 0 (01111111+31) 00000000000000000000000
   *   ===>
   * greater
   *   2^31 <= f < oo
   * return 0x80000000
   */
  if (exp >= 0 && exp < 0 + bias) {
    /* number less than 1 */
    num = 0;
  } else if (exp >= 31 + bias) {
    /* number overflow */
    /* or f < 0 and (int)f == INT_MIN */
    num = 0x80000000;
  } else {
    E = exp - bias;
    M = frac | 0x800000;
    if (E > 23) {
      num = M << (E - 23);
    } else {
      /* whether sig is 1 or 0, round to zero */
      num = M >> (23 - E);
    }
  }

  return sig ? -num : num;
}

2.97

/*
 * float-i2f.c
 */
#include <stdio.h>
#include <assert.h>
#include <limits.h>
#include "float-i2f.h"

/*
 * Assume i > 0
 * calculate i's bit length
 *
 * e.g.
 * 0x3 => 2
 * 0xFF => 8
 * 0x80 => 8
 */
int bits_length(int i) {
  if ((i & INT_MIN) != 0) {
    return 32;
  }

  unsigned u = (unsigned)i;
  int length = 0;
  while (u >= (1<<length)) {
    length++;
  }
  return length;
}

/*
 * generate mask
 * 00000...(32-l) 11111....(l)
 *
 * e.g.
 * 3  => 0x00000007
 * 16 => 0x0000FFFF
 */
unsigned bits_mask(int l) {
  return (unsigned) -1 >> (32-l);
}

/*
 * Compute (float) i
 */
float_bits float_i2f(int i) {
  unsigned sig, exp, frac, rest, exp_sig /* except sig */, round_part;
  unsigned bits, fbits;
  unsigned bias = 0x7F;

  if (i == 0) {
    sig = 0;
    exp = 0;
    frac = 0;
    return sig << 31 | exp << 23 | frac;
  }
  if (i == INT_MIN) {
    sig = 1;
    exp = bias + 31;
    frac = 0;
    return sig << 31 | exp << 23 | frac;
  }

  sig = 0;
  /* 2's complatation */
  if (i < 0) {
    sig = 1;
    i = -i;
  }

  bits = bits_length(i);
  fbits = bits - 1;
  exp = bias + fbits;

  rest = i & bits_mask(fbits);
  if (fbits <= 23) {
    frac = rest << (23 - fbits);
    exp_sig = exp << 23 | frac;
  } else {
    int offset = fbits - 23;
    int round_mid = 1 << (offset - 1);

    round_part = rest & bits_mask(offset);
    frac = rest >> offset;
    exp_sig = exp << 23 | frac;

    /* round to even */
    if (round_part < round_mid) {
      /* nothing */
    } else if (round_part > round_mid) {
      exp_sig += 1;
    } else {
      /* round_part == round_mid */
      if ((frac & 0x1) == 1) {
        /* round to even */
        exp_sig += 1;
      }
    }
  }

  return sig << 31 | exp_sig;
}