記住一些經常使用的ASCII碼的10進制數字是頗有必要的,好比說A是65,a是97,0是48。同一個字母,大寫字母比小寫字母小32。編程
隨着計算機技術的發展,ASCII碼逐漸知足不了人們的需求了,主要包括以下幾點:測試
因此ASCII碼就被擴充了。擴充後的是增長了一位的,也就是從原來的7位變爲8位,擴充後的編碼叫作 Extend ASCII碼。
拓展的ASCII碼增長了一些英標、希臘符號、歐洲字符、表格符、其餘經常使用符等一些字符。網站
事實上,不少國家的語言是有限字符構成的,然而我國文化博大精深,中文則是不以有限字符組合的語言。因此字符編碼集的國際化就頗有必要。編碼
國標2312是我國最先的比較完畢的一個編碼集,全稱叫:信息交換用漢字編碼字符集,包括7前多個字符。spa
因爲GB2312的規範性不被國家承認,因此我國又發命了GBK(國標擴)這種編碼集,全稱叫:漢字內碼擴展規範。
它向下兼容GB2312,向上支持國際ISO標準。收錄了2.1萬多個漢字,並支持所有中日韓漢字。操作系統
咱們須要一種全世界通用的字符編碼,舉個例子,好比美國的tom要訪問中國的一個網站,若tom的電腦上沒有安裝GBK這種支持中文的編碼集,則他看到的中文網站將是一片亂碼。因此咱們不只要有一個本地化的編碼,還學要一個全球化的編碼集。code
Unicode :統一碼、萬國碼、單一碼,支持世界上全部國家的語言編碼,定義了世界通用的符號集,UTF-*實現了編碼。
好比說咱們日常使用的UTF-8是以字節爲單位對Unicode進行編碼。圖片
① 平時編程時,建議使用Unicode字符集, 建議使用UTF-8
②中國的Windows系統是默認使用GBK編碼方式的。因此在平時設置IDE的時候咱們也要注意下。
③字符集在記事本上的更改: 記事本默認的存儲編碼是ANSI。
在簡體中文系統下,ANSI 編碼表明GB2312 編碼,在日文操做系統下,ANSI 編碼表明JIS 編碼。
咱們在桌面新建一個測試記事本,並輸入如下內容文檔
點擊另存爲,能夠看到,下方有個編碼的選項,默認選擇ANSI就是GBK編碼。數學
咱們對保存後的文本文檔,點擊右鍵選擇打開方式,咱們換成另外一個文本文檔軟件,在此使用sublime打開,咱們發現:
咱們發現中文字符所有亂碼,這是因爲GBK的中文編碼和UTF-8的中文編碼不一致形成的,這也是爲何咱們平時在IDE上打中文註釋移到記事本亂碼的緣由。
咱們在換過來講明下,下面是將sublime中的中文文檔轉至記事本的狀況:
咱們點擊另存爲保存後,使用TXT打開:
發現此時text的編碼是UTF-8的。實時上我可使用記事本任意切換UTF和GBK這兩種編碼方式,當咱們遇到GBK和UTF編碼的亂碼,而且是由於這兩種格式的中文編碼不一樣致使時,咱們不妨使用上面這種方法,讓中文編碼變成正常的形式。