計算機只認識0和1html
那字符串「abc」咋顯示呢? 有個相似於字典的東西,告訴計算機在此種狀況(在此編碼格式)下,某些數字該顯示什麼。微信
這種字典,就是字符集編碼
目前主要有如下幾種字符集:.net
共收錄128個字符,都是些最最基礎的字符。詳情請看百度百科code
大小:佔一個字節cdn
ASCII字符集的擴充。共收錄256個字符。ASCII字符集基礎上擴充了128個西歐經常使用字符(包括德法兩國的字母)htm
大小:佔一個字節blog
劃重點:made in china。 百度百科~曰:」共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西裏爾字母在內的682個全角字符。「詳情請看百度百科unicode
兼容ASCII字符集。字符串
大小:若是該字符在ASCII字符集中,則採用1字節編碼。不然採用2字節編碼。
劃重點:made in china。 繼GB2312字符集
以後中國又出的一套標準。這套更牛逼:不只徹底兼容GB2312字符集。還擴充了不少: 」共23940個碼位,共收錄了21003個漢字...所有中日韓漢字...「 總之一個字:牛逼!
大小:若是該字符在ASCII字符集中,則採用1字節編碼。不然採用2字節編碼。
牛逼的玩意兒來了。先看看它的中文譯名:統一碼、萬國碼、單一碼。 收錄地球上的全部字符,如今還在不斷擴充。 可是,須要注意的是,Unicode只是一個符號集,它只規定了符號的二進制代碼,卻沒有規定這個二進制代碼應該如何存儲。
其中,Unicode編碼規定的符號代碼必須以」U+」作前綴。
編號怎麼對應到二進制表示呢?有多種方案:主要有 UTF-8,UTF-16,UTF-32。
參考文獻:
互聯網技術窩
或者加微信共同探討交流: