日本遊戲進口到中國----》中國的電影沒有 日本的編碼集----》致使亂碼windows
要想不亂----》裝語言包----》可以正常顯示日文 編碼
聯合國 萬國碼 -----》支持全球全部的語言spa
1. unicode , 2-4個字節,已經收錄136690個字符(中文就有2萬多個字符),而且一直在不斷擴張中。。。。。code
2. 還能夠與全球各個 語言進行轉換, unicode----》gbk 等等 1990年左右 orm
1. 1980年,當時不少軟件都基於gb2312開發的,轉向unicode 的話基本等於推到重來遊戲
2. Unicode = 英語,gbk = 漢語,沒有強烈的需求全都轉爲Unicode內存
全球計算機廠商出廠的都支持Unicode,大多數軟件的程序都支持Unicodeutf-8
中國的windows 電腦上都是gbk編碼的unicode
Unicode 又帶來一個新問題, 在內存裏空間大沒問題 ,若是要傳輸或者存在硬盤上,空間大了一倍浪費+效率低開發
針對unicode的傳輸+存儲,作了一個utf-8(全稱:Unicode Transformation Format ,學術名UTF ),總共有三個版本,utf - 8 ,utf - 16 ,utf - 32
UTF - 8 :使用一、二、三、4個字節表示全部字符;優先使用1個字符,無法知足則使增長1個字節,最多4個字節,英文佔1個字節,歐洲語系佔2個,東亞佔3個,其餘及特殊字符佔4個字節
字符 | ACSII | Unicode | UTF -8 |
A | 01000001 | 00000000 01000001 | 01000001 |
中 | x | 01001110 00101101 | 11100100 10111000 10101101 |
py 2 = ACSII
py 3 = Unicode
編寫程序前須要先聲明用什麼方式編碼