區位碼、國標碼、機內碼

1、區位碼編碼

       1980年,爲了使每個漢字有一個全國統一的代碼,我國頒佈了第一個漢字編碼 國家標準 GB2312-80《信息交換用漢字編碼字符集》基本集,這個字符集是我國中文信息處理技術的發展基礎,也是目前國內全部漢字系統的統一標準。
國標碼是一個四位十六進制數,區位碼是一個四位的十進制數,每一個國標碼或區位碼都對應着一個惟一的漢字或符號,但由於十六進制數咱們不多用到,因此你們經常使用的是區位碼,它的前兩位叫作區碼,後兩位叫作位碼。
    漢字庫分佈狀況以下:
      
 一級漢字  16-55
      
 二級漢字  56-87
      
 三級漢字  1-9
      
 空閒未用  10-15
  一般,在DOS下的各漢字系統中,同時按Alt鍵和F1鍵便可調用區位碼輸入方法。而在Windows中經常使用Ctrl+空格鍵和Ctrl+Shift鍵調出區位碼。如「2901」表明字,「4582」表明字,「8150」表明字,這些都是漢字,用區位碼還能夠很輕鬆地輸入特殊符號,好比,「0189」表明」(符號)「0528」表明」(日本語),「0711」表明「Й」(俄文)「0949」表明」(製表符)
  在區位碼中,01-09區爲特殊字符,10-55區爲一級漢字(3755個最經常使用的漢字,按拼音字母的次序排列)56-87區爲二級漢字(3008個漢字,按部首次序排列) 在區位碼漢字輸入方法中,漢字編碼無重碼,在熟練掌握漢字的區位碼後,錄入漢字的速度是很快的,但若想記憶住所有區位碼是至關困難的,常使用於錄入特殊符號,如製表符、希臘字母等,這裏簡單介紹幾個區。
spa

區位碼 - 部分國際區位編碼操作系統

  區號:01 【各種符號】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0100  、  · ˉ ˇ ¨   -  ‖ … ' ' " "   
0120      」『      ± × ÷    ∑ ∏ 
0140  ∩   √      ∫  ≡  ≈   ≠   
0160 ≤ ≥ ∞   ♂ ♀ ° ′ ″   ¤   ‰ § №   
0180 ○ ●    □ ■  ▲  → ← ↑ ↓  
  區號:02 【各種數字】 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0200             
0220                     
0240                     
0260                  
0280             
  區號:03 【符號、字母】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
0300       '(            
0320                    
0340                     
0360    _                 
0380                
  區號:06 【羅馬字母】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
0600 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ 
0620Υ Φ Χ Ψ Ω α β γ δ ε ζ η 
0640θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω 
0660 0680
  區號:08 【漢語拼音】 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
0800 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ ò ū ú ǔ 
0820 ù ǖ ǘ ǚ ǜ ü ê    
0840                     
0860               
0880 
  區號:09 【製表字符】 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
0900 ─  │          ┌    
0920 ┐    └    ┘    ├        
0940 ┤        ┬        ┴    
0960     ┼                
0980htm

 

2、機外碼get

機外碼 目前經常使用的機外碼主要有區位碼,國標碼,首尾碼,拼音碼,五筆字型等it

3、國標碼基礎

中國國家標準漢字信息交換碼file

2、區位碼、國標碼、機內碼方法

漢字機內碼,又稱漢字ASCII,簡稱內碼,指計算機內部存儲,處理加工和傳輸漢字時所用的由01符號組成的代碼。輸入碼被接受後就由漢字操做系統輸入碼轉換模塊轉換爲機內碼,與所採用的鍵盤輸入法無關。機內碼是漢字最基本的編碼,無論是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各類處理。技術

  漢字在計算機內部其內碼是惟一的。由於漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII和漢字國標碼時,將會產生二義性。例如:有兩個字節的內容爲30H21H,它既可表示漢字的國標碼,又可表示西文「0」「!」ASCII碼。爲此,漢字機內碼應對國標碼加以適當處理和變換。

GB碼的機內碼爲二字節長的代碼,它是在相應GB碼的每一個字節最高位上加「1」,即

  漢字機內碼=漢字國標碼+8080H

  例如,上述字的國標碼是3021H,其漢字機內碼則是B0A1H

  漢字機內碼的基礎是漢字國標碼

  機內碼:爲了不ASCII碼和國標碼同時使用時產生二義性問題,大部分漢字系統都採用將國標碼每一個字節高位置1做爲漢字機內碼。這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具備極簡單的對應關係。

漢字機內碼、國標碼和區位碼三者之間的關係爲:區位碼(十進制)的兩個字節分別轉換爲十六進制後加20H獲得對應的國標碼;機內碼是漢字交換碼(國標碼)兩個字節的最高位分別加1,即漢字交換碼(國標碼)的兩個字節分別加80H獲得對應的機內碼;區位碼(十進制)的兩個字節分別轉換爲十六進制後加A0H獲得對應的機內碼。

  舉例:機內碼位BEDF,求區位碼?

  有兩種解法:1.BEDFH-A0A0H=1E3FH=7743D

2.BEDFH-8080H=3E5FH(國標碼),3E5FH-2020H=1E3FH=7743D

相關文章
相關標籤/搜索