utf-8編碼:自動將英文保存爲1個字符,中文3個字符。ASCll編碼被囊括在內。python
unicode:將全部字符保存爲2給字符,容納了世界上全部的編碼。函數
replace()函數:替換字符串內字符學習
str1='a1234'編碼
str2=str1.replace('a','A') #將字符a替換爲A操作系統
須要注意的是,在函數replace()的做用下,雖然修改了str1的內容,可是變量str1不變,其修改存儲在str2中。翻譯
ord()函數:獲取字符的utf-8編碼的整數形式。code
ord('A') #輸出65orm
ord('中') #輸出20013utf-8
chr()函數:將utf-8的整數形式轉換爲對應字符。unicode
chr('67') #輸出'C'
chr('25991') #輸出'文'
encode()函數:獲取字符對應編碼方式的16進制形式。
'我'.encode('utf-8') #輸出b'\xe6\x88\x91'
其中b表示以字節的方式存儲,在utf-8編碼中,中文有3個字節,轉化爲三個16進制數。
decode()函數:解碼函數,將上述獲得的數字按照對應的編碼形式翻譯爲對應字符
b'\xe6\x88\x91'.decode('utf-8',errors='ignore') #輸出'我'
其中errors='ignore'表示忽視錯誤字節,如輸入四個字節時,默認讀取前三個。
len()函數:用於計算字符串的長度或字節數
爲了確保解釋器以utf-8編碼讀取文件,須要在文件開頭寫上兩行註釋
# !/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行用於告訴Linux操做系統,這是Python文件,第二行說明文字編碼方式。
與C語言相同,用「%」獲取,格式以下
'Today is %s , i have $' % ('good','10000')
格式 | 內容 |
---|---|
%d | 整數 |
%f | 浮點數 |
%s | 字符串 |
%x | 16進制數 |
%% | % |
format()函數:用於傳入參數
'Hello, {0}! You have ${1}'.format('li',100000)