python基礎之小數據池、代碼塊、編碼

時間 2019-11-12

標籤 python 基礎之小數據代碼編碼欄目 Python 简体版

原文原文鏈接

1、代碼塊。
if True:
　　print(333)
　　print(666)python

while 1:
　　a = 1
　　b = 2
　　print(a+b)緩存

for i in '12324354':
　　print(i)網絡

雖然上面的縮進的內容都叫代碼塊，可是他不是python中嚴格定義的代碼塊。
python中真正意義的代碼塊是什麼？socket

塊是一個python程序的文本，他是做爲一個單元執行的。
代碼塊：一個模塊，一個函數，一個類，一個文件等都是一個代碼塊。函數

而對於一個文件中的兩個函數，也分別是兩個不一樣的代碼塊：post

def func():
　　print(333)
class A:
　　name = 'xiaojing性能

交互模式下，每一行是一個代碼塊。優化

什麼叫交互方式？就是我們在cmd中進入Python解釋器裏面，每一行代碼都是一個代碼塊
>>> i1 = 520 能夠理解爲這一行在一個文件中。
>>> i2 = 520 能夠理解爲這一行在另外一個文件中。this

2、id is ==編碼

在Python中，id是什麼？id是內存地址，== 是比較的兩邊的數值是否相等，而 is 是比較的兩邊的內存地址是否相等。

若是內存地址相等，那麼這兩邊實際上是指向同一個內存地址。

name = 'shuaige' # 賦值
print('shuaige' == 'shuaige') # 數值相同
name = 'abc123'
name1 = 'abc123'
print(id(name),id(name1)) # 2370269674608 2370269674608
在內存中id都是惟一的，若是兩個變量指向的值的id相同，就證實他們在內存中是同一個。
is 判斷的是兩個變量的id值是否相同。
若是is是True, == 必定是True。== 是True,is不必定是True

3、小數據池（緩存機制，駐留機制）

小數據池的應用的數據類型：整數，必定規則的字符串，bool值

小數據池是python對內存作的一個優化：
python將 -5 ~256 的整數，以及必定規則的字符串，bool值，進行了緩存，就是提早在內存中建立了池（容器），
在這些容器裏固定的放了這些數據。
爲何這麼作？？？
1，節省內存。
2，提升性能與效率。

int：對於整數來講，小數據池的範圍是 -5~256 ，若是多個變量都是指向同一個（在這個範圍內的）數字，他們在內存中指向的都是一個內存地址。
i1 = 110
i2 = 110

i3 = 110

必定規則的字符串？

1,字符串的長度爲0或者1，默認都採用了駐留機制（小數據池）

2,字符串的長度>1,且只含有大小寫字母，數字，下劃線時，纔會默認駐留。

3,用乘法獲得的字符串，分兩種狀況。

3.1 乘數爲1時：僅含大小寫字母，數字，下劃線，默認駐留。

3.1.2含其餘字符，長度<=1,默認駐留。

3.1.3含其餘字符，長度>1,默認駐留

3.2 乘數>=2時：僅含大小寫字母，數字，下劃線，總長度<=20,默認駐留。

4，指定駐留。

from sys import intern
a = intern('hello!@'*20)
b = intern('hello!@'*20)
print(a is b)
#指定駐留是你能夠指定任意的字符串加入到小數據池中，讓其只在內存中建立一個對象，多個變量都是指向這一個字符串。

4、代碼塊與小數據池的關係

一樣一段代碼，爲何在交互方式中(cmd命令的終端)執行，和經過pycharm執行結果不一樣呢？

# pycharm 經過運行文件的方式執行下列代碼：
i1 = 520
i2 = 520
print(i1 is i2)  # 結果爲True
經過交互方式中執行下面代碼：
>>> i1 = 520
>>> i2 = 520
>>> print(i1 is i2) #結果爲False

那爲何結果會不一樣呢？

在同一個代碼塊中的變量(數字，字符串)，初始化對象的命令時，首先會從小數據池中找，若是沒有找到，它會將變量與值的對應關係放到一個字典中，
同一個代碼塊中的其餘變量遇到初始化對象的命令，他會先從字典中尋找，若是存在相同的值，他會複用，指向的都是同一個內存地址。

因此，在pycharm中的兩行變量賦值中（實際上在同一個代碼塊中的賦值）：
(若是這個變量不是數字或者字符串，那麼值相同，地址也是不一樣的)

s1 = 1000

s2 = 1000

print(s1 is s2) #True

而在cmd命令的終端中（交互模式），每一行都是一個代碼塊，所以在cmd命令的終端中，s1和s2是在不一樣的代碼塊，所以s1 is s2 是False

l1 = [1,2]
l2 = [1,2]
print(id(l1),id(l2)) # 1745841050760 1745840183304
print(l1 == l2) # True
print(l1 is l2) # False

在不一樣的代碼塊：初始化對象的命令時，首先從小數據池中尋找,若是在小數據池，那麼地址相同，若是不在小數據池中，則建立新的地址。

不一樣代碼塊中：

def func():
    i1 = 1000
    print(id(i1))


def func1():
    i2 = 1000
    print(id(i2))
func()
func1()
# 一個函數是一個代碼塊，所以這裏的i1的地址跟i2的地址不是同一個地址

總結：
同一代碼塊中：
若是變量在小數據池，那麼地址相同，
若是不在小數據池，那麼若是變量是數字或者字符串，也會複用地址，地址也相同，
若是變量不是數字或者字符串，那麼地址不一樣。

不一樣一代碼塊中：
若是變量在小數據池，那麼地址相同，
若是不在小數據池，那麼地址不一樣。

5、編碼二
ASCII: 字母，數字，特殊字符。
A: 0000 0010
B: 0000 0011
unicode: 萬國碼，包含世界上全部的文字。
建立之初：16位
A ：0001 0010 0000 0010
中：0011 0010 0000 0110
升級：32 位
A ：0000 0010 0100 0010 0000 0010 1000 0010
中：0001 0010 0010 0010 0000 0010 0010 0010
缺點：浪費資源。