【字符知識】SGML 類語言(Eg.HTML)字符轉義

字符引用示例

&name;
&#dddd;
&#xhhhh;
  • 以上示例,均屬於SGML類語言的字符轉義序列(escape sequence),他們不是編碼。這種字符轉義的形式被稱做character reference。
  • SGML類語言:包括HTML、XML等在內的標記語言。
     
     

實體字符引用(character entity reference)

  • "& + 預約義的entity名稱 + 分號"指代字符;
  • 優勢是便於記憶,缺點是可指代的字符有限;

數字字符引用(numeric character reference / NCR)

  • "&#x + Unicode編碼十六進制數值 + 分號"html

  • "&# + Unicode編碼的十進制數值 + 分號"網絡

  • 從HTML4開始,NCR便以Unicode爲標準,而與當前文檔編碼種類無關。網站

emoji實體字符編碼

  • "&#x + Unicode編碼十六進制數值 + 分號"編碼

  • "&# + Unicode編碼的十進制數值 + 分號".net

  • 與普通字符區別:emoji屬於四字節單字符,較普通的USC-2字符編碼的2字節字符,是其的兩倍。因此在符合USC-2編碼規範的語言中,emoji一般被轉義成兩個字符的編碼,比普通的字符編碼要長。【Unicode編碼十六進制數值參考:emoji表情unicode值「U+」後面的16進制代碼(轉換成10進制即爲上文中的「Unicode編碼的十進制數值」。16進制與10進制代碼都可使用)】【代碼參考:http://www.unicode.org/emoji/charts/full-emoji-list.htmlcode

  • emoji字符的提交與轉義問題:請參考 http://blog.csdn.net/binjly/article/details/47321043
  • emoji起源:
    • Emoji圖標最初由日本移動運營商開始使用,好比NTT DoCoMo,au,軟銀移動(前身爲沃達豐)。世界上首個emoji圖標是由日本人慄田穰崇(Shigetaka Kurita)在1998年或1999年時創造出來的,其中一部分屬於NTT DoCoMo團隊在打造移動網絡平臺時的工做成果。慄田從天氣預報使用圖標來表示天氣這一舉動中得到了靈感,而日本漫畫也給予了慄田啓發,在漫畫中有一堆圖標能夠用來表示人物情緒。

參考資料

【1】https://isux.tencent.com/emoji-design-typeface.html emoji繪文字——多終端適配
【2】http://blog.csdn.net/binjly/article/details/47321043 移動端emoji字符提交與轉義
【3】http://www.ruanyifeng.com/blog/2014/12/unicode.html JS與Unicode詳解
【4】http://tieba.baidu.com/p/4898499851 JS的Unicode天坑
【5】http://emojipedia.org/ emoji百科
【6】http://www.unicode.org Unicode協會官方網站
【7】http://www.unicode.org/emoji/charts/emoji-released.html emoji4.0新增
【8】http://www.unicode.org/emoji/charts/full-emoji-list.html emoji4.0 所有
【9】http://www.unicode.org/emoji/charts/index.html emoji官方說明文檔(unicode協會)
【10】http://fashion.163.com/15/1210/07/BAF78KKF00264MK3.html emoji歷史htm

相關文章
相關標籤/搜索