字符串池化 python

前言

在 Python 中常常經過內存池化技術來提升其性能,那麼問題來了,在什麼狀況下會池化呢? 讓咱們經過幾個例子進行一下理解一下.html

預備知識

在查看例子以前,首先要提 python 中的一個函數 id(),讓咱們看一下函數說明:python

id(obj, /)
    Return the identity of an object.

    This is guaranteed to be unique among simultaneously existing objects.
    (CPython uses the object \'s memory address.)

經過上述說明,能夠得知 id() 將會返回對像的惟一標識,在 CPython 中將會返回內存地址,也就是說若是兩個對象 的 id 值同樣,能夠說着兩個對象是相同的了.bash

例子

example 00ide

a = ""
b = ""
print(id(a),id(b))
print(a is b)

輸出結果:函數

>>> a = ""
>>> b = ""
>>> print(id(a),id(b))
2114853370544 2114853370544
>>> print(a is b)
True

example 01post

a = "a"
b = "a"
print(id(a),id(b))
print(a is b)

輸出結果:性能

>>> a = "a"
>>> b = "a"
>>> print(id(a),id(b))
2114883022608 2114883022608
>>> print(a is b)
True

example 02優化

a = "magic_string"
b = "magic" + "_" + "string"
print(id(a),id(b))
print(a is b)

輸出結果:ui

>>> a = "magic_string"
>>> b = "magic" + "_" + "string"
>>> print(id(a),id(b))
2114887161136 2114887161136
>>> print(a is b)
True

example 03code

a = "magic!"
b = "mgaic!"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "magic!"
>>> b = "mgaic!"
>>> print(id(a),id(b))
2114885855416 2114889455408
>>> print(a is b)
False

example 04

a,b = "magic!","magic!"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a,b = "magic!","magic!"
>>> print(id(a),id(b))
2114885691912 2114885691912
>>> print(a is b)
True

example 05

a = "!"
b = "!"
print(id(a),id(b))
print(a is b)

輸出結果:

>>> a = "!"
>>> b = "!"
>>> print(id(a),id(b))
140564571922024 140564571922024
>>> print(a is b)
True

example 06

print(a*20 is 'aaaaaaaaaaaaaaaaaaaa')
print(a*21 is 'aaaaaaaaaaaaaaaaaaaaa')

輸出結果:

>>> print(a*20 is 'aaaaaaaaaaaaaaaaaaaa')
False
>>> print(a*21 is 'aaaaaaaaaaaaaaaaaaaaa')
False

總結

經過上述 7 個例子,咱們不難對 python 的字符串池化有個大概的認識,咱們這裏作個簡單的總結:

  1. 經過 example 00,01,05,咱們能夠得出對於長度爲 0 或者 1 的字符串會被池化
  2. 經過 example 02,03,咱們能夠得出字符串中只包含字母數字以及下劃線的字符串會被池化
  3. 經過 example 04, 咱們能夠得出當在同一行對不一樣變量,賦值若是相同的話,它們將會指向同一個對象,注意這裏面的 「magic!」 並不符合池化的要求,這只是一種編譯器的優化
  4. example 06 所出現的現象在 python 中有一個專業的術語,講常量摺疊(constant folding),顧名思義,在編譯優化時,講可以計算出的結果的變量直接替換爲常量.可是這沒有限制嗎?顯然不是的,在咱們的例子中已經發現,當長度超過20的時候,摺疊就會失效了,試想一下,若是沒有限制的話,初始化的字符串過長,將會嚴重致使性能的降低以及內存的消耗

參考連接

  1. The internals of Python string interning

  2. exploring python code objects

  3. Python string interning

  4. Python String objects implementation

相關文章
相關標籤/搜索