Python2:
Unicode是一種通用的編碼方式,不管是英文字母、漢字、日語仍是其餘文字都可以對應一個惟一的Unicode編碼(序號)。python
chr(100) # 獲得整數對應的ascii碼(小於256) ord('?') # 獲得一個ascii字符對應的ascii碼 int('4f60',16) # 從16進制數獲得對應的十進制數 hex(20320) # '0x4f60' #隨機生成中文: import random #print unichr(random.randint(0x4E00, 0x9FBF)).encode('utf8') def Unicode(): val = random.randint(0x4E00, 0x9FBF) return unichr(val) def GB2312(): head = random.randint(0xB0, 0xCF) body = random.randint(0xA, 0xF) tail = random.randint(0, 0xF) val = ( head << 8 ) | (body << 4) | tail str = "%x" % val return str.decode('hex').decode('gb2312') #獲取字符串對應的字節碼,Unicode碼(16進制,10進制) s='圖' s #'\xe5\x9b\xbe' type(s) #<type 'str'> s_Unicode=s.decode('utf8') s_Unicode_int = ord(s_Unicode) 「」「 s_Unicode #u'\u56fe' s_Unicode_str = repr(s_Unicode) s_Unicode_str #"u'\\u56fe'" s_Unicode_int = int(s_Unicode_str.replace("u'\\u","").replace("'",""),16) s_Unicode_int #22270 print unichr(22270).encode('utf8') #圖 s_Unicode_hex=hex(s_Unicode_int) s_Unicode_hex #'0x56fe' 」「」
python3:dom