字符編碼--第2章數的存儲

時間 2019-11-17

標籤字符編碼存儲欄目字符編碼简体版

原文原文鏈接

第2章數的存儲函數

第1節機器數測試

計算機中，表示數和數的符號的二進制數，叫作機器數。機器數是帶符號的，在計算機用一個數的最高位存放符號, 正數爲0, 負數爲1。編碼

好比，十進制中的數 +3 ，計算機字長爲8位，轉換成二進制就是00000011。若是是 -3 ，就是 10000011 。那麼，這裏的 00000011 和 10000011 就是機器數。spa

機器數可用不一樣的碼制來表示，經常使用的有原碼、補碼和反碼錶示法。.net

第2節真值設計

由於第一位是符號位，因此機器數的形式值就不等於真正的數值。例如上面的有符號數 10000011，其最高位1表明負，其真正數值是 -3 而不是形式值131（10000011轉換成十進制等於131）。因此，爲區別起見，將帶符號位的機器數對應的真正數值稱爲機器數的真值。code

例：0000 0001的真值 = +000 0001 = +1，1000 0001的真值 = –000 0001 = –1blog

第3節有符號數處理ci

在計算機運算中，有符號數的表示須要將負數編碼爲二進制形式。在數學中，任意基數的負數都在最前面加上「−」符號來表示。然而在計算機硬件中，數字都以無符號的二進制形式表示，所以須要一種編碼負號的方法。當前有四種方法，用於擴展二進制數字系統，來表示有符號數：原碼（sign-and-magnitude），反碼（ones' complement），補碼（two's complement），以及移碼excess-N。開發

1.原碼

原碼就是符號位加上真值的絕對值，符號及值（sign & magnitude）的處理法是分配一個符號位（sign bit）來表示這個符號：設置這個位（一般爲最高有效位）爲0表示一個正數，爲1表示一個負數。數字中的其它位指示數值（或者絕對值）。所以一個字節只有7位（除去符號位），數值的範圍從0000000（0）到1111111（127）。這樣當你增長一個符號位（第八位）後，能夠表示從−12710到+12710的數字。這種表示法致使的結果就是能夠有兩種方式表示零，00000000（0）與10000000（−0），這大大增長數碼電路的複雜性和設計難度。CPU亦須執行兩次比較，來測試運算結果是否爲零。

十進制數−43用原碼方法編碼成八位的結果爲10101011。

這種方法被直接比較於經常使用的符號表示法（放置一個「+」或者「−」在數字的數值以前）。一些早期的二進制電腦（例如IBM 7090）使用這種表示法，也許是因爲它與通用用途的天然聯繫。原碼是最經常使用的表示浮點數的方法。IEEE二進位浮點數算術標準（IEEE 754）採用最高有效位做爲符號位，所以可表示正負零及正負無限。

2.反碼

另外一方面，一種叫作反碼的系統也能夠用於表示負數（注：正數與原碼形式同樣，無需取反）。一個負數的二進制數反碼形式爲其絕對值部分按位取反（即符號位不變，其他各位按位取反）。同原碼錶示同樣，0的反碼錶示形式也有兩種：00000000（+0）與11111111（−0）。

舉例來講，原碼10101011（-43）的反碼形式爲11010100（−43）。有符號數用反碼錶示的範圍爲−(2N−1−1)到(2N−1−1)，以及+/−0。傳統的表示爲−12710到+12710，以及00000000（+0）或者11111111（−0）。

正數的反碼是其自己, 負數的反碼是在其原碼的基礎上, 符號位不變，其他各個位取反。注意負數的反碼只需按位求數值的補就能夠獲得，符號不須要變更。

3.補碼

補碼（2's complement）是一種用二進制表示有號數的方法，也是一種將數字的正負號變號的方式，常在計算機科學中使用。在臺灣和香港稱爲二補數。數據在計算機中主要是以補碼的形式存儲的。

一個數字的補碼就是將該數字做比特反相運算（即一補數或反碼），再將結果加 1。在補碼系統中，一個負數就是用其對應正數的補碼來表示。正數的補碼就是其自己,負數的補碼是在其原碼的基礎上, 符號位不變, 其他各位取反, 最後+1. (即在反碼的基礎上+1) 。

補碼迴避了0有多種表示的問題以及循環進位的須要。在補碼錶示中，負數以位模式表示爲正值的反碼加1（看成無符號數）。

在補碼錶示中，只有一個0（00000000）。求一個數的否（不管是負數仍是正數）須要反轉全部位，而後加1。一對補碼整數相加等價於一對無符號數相加（除了溢出檢測，若是可以作到的話）。好比，從旁邊的表格能夠看出，127與−128的補碼錶示相加就與無符號數127及128相加具備相同的結果。

補碼系統的最大優勢是能夠在加法或減法處理中，不需由於數字的正負而使用不一樣的計算方式。只要一種加法電路就能夠處理各類有號數加法，並且減法能夠用一個數加上另外一個數的補碼來表示，所以只要有加法電路及補碼電路便可完成各類有號數加法及減法，在電路設計上至關方便。

另外，補碼系統的 0 只有一個表示方式，這點和一補數系統不一樣（在一補數系統中，0 有二種表示方式），所以在判斷數字是否爲 0 時，只要比較一次便可。

8-bit補碼系統的整數。它的可表示的範圍包括-128到127，總共256 (28)個整數。

如下用 4 比特的補碼數字來講明補碼系統的數字表示方式。

在表示正數和零時，二補數數字和通常二進制同樣，惟一的不一樣是在補碼系統中，正數的最高比特恆爲 0，所以4 比特的補碼正數，最大數字爲 0111 (7)。

補碼數字的負數，最高比特恆爲 1，4 比特補碼的數字中，最接近 0 的負數爲 1111 (-1)，以此類推，所以絕對值最大的負數是 1000 (-8)。

在通常 n 比特的二進制數字中，最高有效比特(MSB) 第 n 比特表明的數字爲　2n−1。不過，在 n 比特的補碼系統中，最高有效比特(MSB) 第 n 比特表示符號比特，若符號比特爲 0，數字爲正數或 0，若符號比特爲 1，數字爲負數。

求負數補碼錶示的方法：

　　（1）寫出與該負數相對應的正數的補碼

　　（2）按位求反

　　（3）末位加一

　　例：假設機器字長爲8位，求-46的補碼。

　　　　+ 46的補碼錶示爲： 0010 1110

　　　　按位求反：　　　　1101 0001

　　　　末位加一　　　　　1101 0010

　　　　因此，[-46]補碼 = D2H

符號擴展：是指一個數從位數較少擴展到位數較多，如從8位擴展到16位，或從16位擴展到32位。

　　對於用補碼錶示的數，正數的符號擴展在前面補0，負數的符號擴展在前面補1，假設機器字長爲16位，[+46]補碼 = 002EH，[-46]補碼 = FFD2H。

n位補碼的表數範圍

　　8位二進制數能夠表示=256個數，16位二進制數能夠表示=65536個數，當它們是補碼錶示的帶符號數時，8位二進制的表數範圍是 -128 N +127，

16位二進制的表數範圍是 -32768 N +32767。

　　n位補碼的表數範圍是：

4.移碼

移碼，是將二進制原碼無符號整數所表明的值，減去一個預設值。

標準移碼，預設值爲二進制原碼錶示的最大整數的一半。一個數的標準移碼和補碼，最高位相反，其他各位均相同。

#include <stdio.h>

int main(int argc, char * argv) {

char a;

short b;

a = 127;

b = (short)127;