如今最大的就是TB他們的循序爲TB>GB>MB>KB>B1字節就是1Byte字節 概述字節(Byte)是計算機信息技術用於計量存儲容量和傳輸容量的一種計量單位,1個字節等於8位二進制。 [編輯本段]基本簡介 字節(Byte 發音:/‘bait/):字節是經過網絡傳輸信息(或在硬盤或內存中存儲信息)的單位。
在ASCII碼中,一個英文字母(不分大小寫)佔一個字節的空間,一箇中文漢字佔兩個字節的空間。
符號:英文標點佔一個字節,中文標點佔兩個字節。舉例:英文句號「.」佔1個字節的大小,中文句號「。」佔2個字節的大小
一個二進制數字序列,在計算機中做爲一個數字單元,通常爲8位二進制數,如一個ASCII碼就是一個字節,此類單位的換算爲:
1 艾字節(EiB,Exbibyte)=1024拍字節(2的60次方字節)
(1EiB=1024PiB)
1 拍字節(PB,Pebibyte)=1024太字節(2的50次方字節)
(1PiB=1024TiB)
1太字節(TiB,Tebibyte)=1024吉字節(2的40次方字節)
(1TiB=1024GiB)
1吉字節(GiB,Gibibyte)=1024兆字節(2的30次方字節)
(1GiB=1024MiB)
1兆字節(MiB,Mebibyte)=1024千字節(2的20次方字節)
(1MiB=1024KiB)
1千字節(KiB,Kilibyte)=1024字節(2的10次方字節)(1KiB=1024B)
1字節(Byte)= 8位(bit)
1MiB=1024KiB。,1KiB=1024Byte(Byte表示字節的意思),1Byte=8bit(bit表示二進制的)
1MB=1000KB, 1KB=1000Byet。(注意MiB和MB,KiB和KB等的區別)
注:TiB是如今電腦硬盤最大的存儲量單位。10TiB大約等於一我的腦的存儲量。
更大的單位,還有ZiB(Zebibyte,1ZiB=1024EiB)、YiB(Yobibyte,1YiB=1024ZiB)……
幾個容易混淆的重要概念
字
在計算機中,一串數碼做爲一個總體來處理或運算的,稱爲一個計算機字,簡稱字。字一般分爲若干個字節(每一個字節通常是8位)。在存儲器中,一般每一個單元存儲一個字,所以每一個字都是能夠尋址的。字的長度用位數來表示。
在計算機的運算器、控制器中,一般都是以字爲單位進行傳送的。字出如今不一樣的地址其含義是不相同。例如,送往控制器去的字是指令,而送往運算器去的字就是一個數。
字長
計算機的每一個字所包含的位數稱爲字長。根據計算機的不一樣,字長有固定的和可變的兩種。固定字長,即字長度不論什麼狀況都是固定不變的;可變字長,則在必定範圍內,其長度是可變的。
計算的字長是指它一次可處理的二進制數字的數目。計算機處理數據的速率,天然和它一次能加工的位數以及進行運算的快慢有關。若是一臺計算機的字長是另外一臺計算機的兩倍,即便兩臺計算機的速度相同,在相同的時間內,前者能作的工做是後者的兩倍。
通常地,大型計算機的字長爲32―64位,小型計算機爲12―32位,而微型計算機爲4一16位。字長是衡量計算機性能的一個重要因素。
字節
字節是指一小組相鄰的二進制數碼。一般是8位做爲一個字節。它是構成信息的一個小單位,並做爲一個總體來參加操做,比字小,是構成字的單位。 在微型計算機中,一般用多少字節來表示存儲器的存儲容量。 1.2 字符,字節,字符串 理解編碼的關鍵,是要把字符的概念和字節的概念理解準確。這兩個概念容易混淆,咱們在此作一下區分: 概念描述 舉例 字符 人們使用的記號,抽象意義上的一個符號。 '1', '中', 'a', '$', '¥', …… 字節 計算機中存儲數據的單元,一個8位的二進制數,是一個很具體的存儲空間。0x01, 0x45, 0xFA, …… ANSI 字符串 在內存中,若是「字符」是以ANSI編碼形式存在的,一個字符可能使用一個字節或多個字節來表示,那麼咱們稱這種字符串爲 ANSI 字符串或者多字節字符串。如,"中文123" (佔7字節)。 字符集和代碼頁 對於ANSI編碼方式,存在不一樣的字符集(Charset)。一樣的字節序列,在不一樣的字符集下表示的字符不同。要正確解析一個ANSI字符串,還要選擇正確的字符集,不然就可能致使所謂的亂碼現象。不一樣語言版本的操做系統,都有一個默認的字符集。在不指定字符集的狀況下,系統會使用此字符集來解析 ANSI 字符串。也就是說,若是咱們在簡體中文版的Windows下打開了一個由日文操做系統保存的 ANSI 文本文件(僅包含 ANSI 字符串的文本文件),咱們看到的將是亂碼。可是,若是咱們使用Visual Studio之類的帶編碼選擇的文本編輯器打開此文件,而且選擇正確的字符集,咱們將能夠看到它的原貌。注意:簡體中文字符集中的繁體字和繁體中文字符集中的繁體字,編碼不必定相同(事實證實,彷佛是徹底不一樣)。 每一個字符集都有一個惟一的編號,稱爲代碼頁(Code Page)。簡體中文(GB2312)的代碼頁爲936,而系統默認字符集的代碼頁爲0,它表示根據系統的語言設置來選擇一個合適的字符集。 UNICODE 字符串 在內存中,若是「字符」是以在Unicode中的序號存在的,那麼咱們稱這種字符串爲Unicode字符串或者寬字節字符串。在Unicode中,每一個字符都佔兩個字節。如,"中文123"(佔10字節)。 Unicode和ANSI的區別就至關於輸入法內的「全角」和「半角」的區別。 因爲不一樣 ANSI 編碼所規定的標準是不相同的(字符集不一樣),所以,對於一個給定的多字節字符串,咱們必須知道它採用的是哪種字符集則,纔可以知道它包含了哪些「字符」。而對於 UNICODE 字符串來講,無論在什麼環境下,它所表明的「字符」內容老是不變的。Unicode 有着統一的標準,它定義了世界上絕大多數的字符的編碼,使得拉丁文、數字、簡體中文、繁體中文、日文等都能一同一種編碼方式保存。