編碼的種類

日本遊戲進口到中國----》中國的電影沒有 日本的編碼集----》致使亂碼windows

要想不亂----》裝語言包----》可以正常顯示日文   編碼

聯合國       萬國碼   -----》支持全球全部的語言spa

1. unicode ,   2-4個字節,已經收錄136690個字符(中文就有2萬多個字符),而且一直在不斷擴張中。。。。。code

2. 還能夠與全球各個 語言進行轉換, unicode----》gbk 等等                1990年左右    orm

   1. 1980年,當時不少軟件都基於gb2312開發的,轉向unicode 的話基本等於推到重來遊戲

   2. Unicode = 英語,gbk = 漢語,沒有強烈的需求全都轉爲Unicode內存

   全球計算機廠商出廠的都支持Unicode,大多數軟件的程序都支持Unicodeutf-8

中國的windows 電腦上都是gbk編碼的unicode

Unicode 又帶來一個新問題, 在內存裏空間大沒問題 ,若是要傳輸或者存在硬盤上,空間大了一倍浪費+效率低開發

針對unicode的傳輸+存儲,作了一個utf-8(全稱:Unicode Transformation Format ,學術名UTF ),總共有三個版本,utf - 8 ,utf - 16 ,utf - 32

UTF - 8 :使用一、二、三、4個字節表示全部字符;優先使用1個字符,無法知足則使增長1個字節,最多4個字節,英文佔1個字節,歐洲語系佔2個,東亞佔3個,其餘及特殊字符佔4個字節

 

字符 ACSII Unicode UTF -8
A 01000001 00000000 01000001 01000001
x 01001110 00101101    11100100 10111000 10101101

                                                                                                               

py 2 = ACSII

py 3 = Unicode

編寫程序前須要先聲明用什麼方式編碼

相關文章
相關標籤/搜索