Python中,u表示unicode string,表示使用unicode進行編碼,沒有u表示byte string,類型是str,在沒有聲明編碼方式時,默認ASCI編碼。若是要指定編碼方式,可在文件頂部加入相似以下代碼:python
# -*- coding: utf-8 -*-
utf-8是一種支持中文的編碼格式。正則表達式
字母前加r表示raw string,也叫原始字符串常量。通常用在一下兩個方面:編碼
一、正則表達式
用於處理正則表達式時,規避反斜槓的轉義
3d
二、系統路徑
以下面的路徑,使用r就防止了\t的轉義
code
擴展資料:
python在執行代碼是,全部的計算都會由內存進行,此時的編碼格式是unicode,由於世界上存在着多種編碼方式,同一個二進制數字能夠被解釋成不一樣的符號。爲了統一編碼格式,便於計算,就出現了unicode。blog
去掉python內置的轉義意義(也就是不轉義了)
簡單來講「\n\tbce」這樣的字符串、因爲\t和\n在python有本身特殊的意義、若是你須要在字符串中保持\t的原始意義、就須要在r"\n\tbce",這樣以來就不會吧\t \n轉義成換行。內存
這個是表示不轉義,使用真實字符。
好比,以下代碼:
s = r'test\tddd'
s2 = 'test\tddd'
print(s)
print(s2)
輸出結果是:
test\tddd
test ddd
其中s裏面的\t就是使用真實字符\t,而不是轉義爲製表符。utf-8