常見字符集

時間 2019-11-16

標籤常見字符集简体版

原文原文鏈接

1. 常見字符集

計算機內部全部的信息最終都是一個二進制的值，無論是文本信息或者是圖像等的其餘信息網絡

1.1 文字

計算機內部文字的存儲就是提早的約定，1（二進制00000001）表明某個字符，32（二進制00100000）表明空格編碼

1.2 圖像

人類已經明白能夠經過組合不一樣比例的紅，綠，藍三種顏色來獲得各類各樣的顏色，如今的計算機，通常使用32位來表示顏色，4B。前三個B分別表明紅，綠，藍，一個byte中8bit,能夠表示256種紅，因此3B總共能夠表示256 256 256 = 16777216種顏色，剩下一B用來表示透明度，圖片是像素級的小格子組成的所以圖片也能夠用二進制組成code

總之，計算機內部一切都是由二進制組成的圖片

1.3ASCII

上世紀60年代，美國對英文字符，空格等的一系列符號與數字作了對應，一共128個，只佔用了一個字節的後7位，第一位爲0utf-8

1.4 非ASCII編碼

ISO-8859-1:ISO組織在ASCII編碼的基礎上又制定了一系列的標準來擴展ASCII編碼，仍然是單字節編碼，最多表示256個字符，但已涵蓋了大多數西歐語言
GB2312：雙字節編碼，包含6763個漢字
GBK：國家監督技術局擴展GB2312，加入了更多的漢字，兼容GB2312，用GB2312編碼的漢字能夠用GBK來解碼