小白的Python 學習筆記(七)神奇寶藏 Collections

神奇的collections

你們好,今天想簡單總結一下Python裏一個很是棒的模快:Collectionsbash

該模塊實現了專門的容器數據類型,爲Python的通用內置容器提供了替代方案,若是對源碼感興趣的朋友們能夠在 Lib/collections/init.py 路徑下找到app

基於我目前的學習經驗,如下幾種類型用的不少:函數

名稱 簡單解釋
defaultdict dict子類調用工廠函數來提供缺失值
counter 用於計算可哈希對象的dict子類
deque 相似於列表的容器,能夠從兩端操做
namedtuple 用於建立具備命名字段的tuple子類的工廠函數
OrderedDict 記錄輸入順序的dict

若是你和我同樣也是小白,看到什麼工廠函數,可哈希對象,容器這些詞彙不要慌,我第一次看是懵逼併直接跳過的,然然後來發現根本不須要太理解,若是你們感興趣能夠本身去查詢,我主要經過大量實例來一個個理解學習

defaultdict

基礎概念ui

「defaultdict」是在名爲「collections」的模塊中定義的容器。它須要一個函數(默認工廠)做爲其參數。默認狀況下設置爲「int」,即0.若是鍵不存在則爲defaultdict,並返回且顯示默認值。spa

我用人話解釋一下: 其實就是一個查不到key值時不會報錯的dictcode

應用實例對象

首先咱們來看一個用正常dict的例子,若是咱們建立了一個叫person的字典,裏面存儲的key值爲name,age,若是這時候嘗試調用person['city'],會拋出KeyError錯誤,由於沒有city這個鍵值:教程

person = {'name':'xiaobai','age':18}
print ("The value of key 'name' is : ",person['name'])
print ("The value of key 'city' is : ",person['city'])

Out: The value of key  'name' is :  xiaobai
Traceback (most recent call last):
  File "C:\Users\E560\Desktop\test.py", line 17, in <module>
    print ("The value of key 'city' is : ",person['city'])
KeyError: 'city'

複製代碼

如今若是咱們用defaultdict再試試呢?索引

from collections import defaultdict
person = defaultdict(lambda : 'Key Not found') # 初始默認全部key對應的value均爲‘Key Not Found’

person['name'] = 'xiaobai'
person['age'] = 18

print ("The value of key 'name' is : ",person['name'])
print ("The value of key 'adress' is : ",person['city'])

Out:The value of key  'name' is :  xiaobai
     The value of key  'adress' is :  Key Not found
複製代碼

此次沒有問題了,其實最根本的緣由在於當咱們建立defaultdict時,首先傳遞的參數是全部key的默認value值,以後咱們添加name,age進去的時候纔會有所改變,當咱們最終查詢時,若是key存在,那就輸出對應的value值,若是不存在,就會輸出咱們事先規定好的值‘Key Not Found’

除此以外,由於咱們在建立defaultdict時,傳參爲全部key默認value值,所以利用這一特性,咱們還能夠實現其餘功能,好比:

from collections import defaultdict
d = defaultdict(list)
d['person'].append("xiaobai")
d['city'].append("paris")
d['person'].append("student")

for i in d.items():
    print(i)

Out: ('person', ['xiaobai', 'student'])
     ('city', ['paris'])

複製代碼

一個道理,咱們默認全部key對應的是一個list,天然就能夠在賦值時使用list的append方法了。再好比下面這個例子:

from collections import defaultdict
food = (
    ('jack', 'milk'),
    ('Ann', 'fruits'),
    ('Arham', 'ham'),
    ('Ann', 'soda'),
    ('jack', 'dumplings'),
    ('Ahmed', 'fried chicken'),
)

favourite_food = defaultdict(list)

for n, f in food:
    favourite_food[n].append(f)

print(favourite_food)

Out:defaultdict(<class 'list'>, 
{'jack': ['milk', 'dumplings'], 
'Ann': ['fruits', 'soda'], 
'Arham': ['ham'], 
'Ahmed': ['fried chicken']})
複製代碼

道理和上面差很少,這裏你們能夠本身拓展,展開想象,相信可能在某個時刻必定能夠用的上defaultdict

counter

基礎概念

Counter是dict的子類。所以,它是一個無序集合,其中元素及其各自的計數存儲爲字典。這至關於其餘語言的bag或multiset。

個人理解就是一個計數器,返回一個字典,key就是出現的元素,value就是該元素出現的次數

應用實例

計數器沒啥可說的,還能幹啥,計數唄!

from collections import Counter
#計數list
count_list = Counter(['B','B','A','B','C','A','B','B','A','C'])  
print (count_list)

#計數tuple
count_tuple = Counter((2,2,2,3,1,3,1,1,1))  
print(count_tuple)

Out:Counter({'B': 5, 'A': 3, 'C': 2})
     Counter({1: 4, 2: 3, 3: 2})
複製代碼

Counter通常不會用於dict和Set的計數,由於dict的key是惟一的,而Set自己就不能有重複元素

如今咱們也能夠直接把在defaultdict例子中用過food元組拿來計數:

from collections import Counter
food = (
    ('jack', 'milk'),
    ('Ann', 'fruits'),
    ('Arham', 'ham'),
    ('Ann', 'soda'),
    ('jack', 'dumplings'),
    ('Ahmed', 'fried chicken'),
)

favourite_food_count = Counter(n for n,f in food)  #統計name出現的次數
print(favourite_food_count)

Out: Counter({'jack': 2, 'Ann': 2, 'Arham': 1, 'Ahmed': 1})

複製代碼

deque

基礎概念

在咱們須要在容器兩端的更快的添加和移除元素的狀況下,可使用deque. 個人我的理解是deque就是一個能夠兩頭操做的容器,相似list但比列表速度更快

應用實例

deque的方法有不少,不少操做和list相似,也支持切片

from collections import deque
d = deque()
d.append(1)
d.append(2)
d.append(3)

print(len(d))
print(d[0])
print(d[-1])

Out: 3
     1
     3
複製代碼

deque最大的特色在於咱們能夠從兩端操做:

d = deque([i for i in range(5)])
print(len(d))
# Output: 5

d.popleft()   # 刪除並返回最左端的元素
# Output: 0

d.pop()       # 刪除並返回最右端的元素
# Output: 4

print(d)
# Output: deque([1, 2, 3])

d.append(100)  # 從最右端添加元素

d.appendleft(-100) # 從最左端添加元素

print(d)
# Output: deque([-100, 1, 2, 3, 100])

複製代碼

除了這些deque的方法實在太多了,好比我再舉幾個經常使用的例子,首先咱們定義一個deque時能夠規定它的最大長度,deque和list同樣也支持extend方法,方便列表拼接,可是deque提供雙向操做:

from collections import deque
d = deque([1,2,3,4,5], maxlen=9)  #設置總長度不變
d.extendleft([0])  # 從左端添加一個list
d.extend([6,7,8])   # 從右端拓展一個list
print(d)

Out:deque([0, 1, 2, 3, 4, 5, 6, 7, 8], maxlen=9)

複製代碼

如今d已經有9個元素了,而咱們規定的maxlen=9,這個時候若是咱們從左邊添加元素,會自動移除最右邊的元素,反之也是同樣:

d.append(100)
print(d)
d.appendleft(-100)
print(d)

Out: deque([1, 2, 3, 4, 5, 6, 7, 8, 100], maxlen=9)
     deque([-100, 1, 2, 3, 4, 5, 6, 7, 8], maxlen=9)
複製代碼

deque還有不少其餘的用法,你們根據各自的須要去本身尋寶吧!

namedtuple

基礎概念

名稱元組。你們一看名字就會感受和tuple元組有關,沒錯,我認爲它是元組的強化版 namedtuple能夠將元組轉換爲方便的容器。使用namedtuple,咱們沒必要使用整數索引來訪問元組的成員。

我以爲能夠把namedtuple 視爲 不可變的 字典

應用實例

首先,讓咱們先回顧一下普通元組是如何訪問成員的:

person = ('xiaobai', 18)
print(person[0])

Out:xiaobai
複製代碼

如今咱們看看namedtuple(名稱元組)的強大之處:

from collections import namedtuple

Person = namedtuple('Person', 'name age city')        # 相似於定義class
xiaobai = Person(name="xiaobai", age=18, city="paris") # 相似於新建對象
print(xiaobai)

Out:Person(name='xiaobai', age=18, city='paris')

複製代碼

咱們建立namedtuple時很是像定義一個class,這裏Person比如是類名,第二個參數就是namedtuple的值的名字了,我感受很像class裏的屬性,不過這裏不用加逗號分離,下面讓咱們看看如何訪問namedtuple的成員:

print(xiaobai.name)
print(xiaobai.age)
print(xiaobai.city)

out:xiaobai
     18
     paris
複製代碼

"爽啊,爽死了",郭德綱看到這裏不由讚歎

這種無限接近class調用屬性的方式仍是很是不錯的,在一些實際場景頗有用。 最後還有一點千萬不要忘了,咱們不能修改namedtuple裏的值:

xiaobai.name = 'laobai'
Out:Traceback (most recent call last):
  File "C:\Users\E560\Desktop\test.py", line 5, in <module>
    xiaobai.name = 'laobai'
AttributeError: can't set attribute 複製代碼

OrderedDict

基礎概念

「OrderedDict」 自己就是一個dict,可是它的特別之處在於會記錄插入dict的key和value的順序

應用實例

from collections import OrderedDict
d = {}
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)

Out:{'a': 1, 'c': 3, 'b': 2, 'd': 4}

複製代碼

你們能夠看到,這是一個普通的dict,由於無序,即便咱們依次添加了a,b,c,d 四個鍵並賦予value,可是輸出的順序並不可控。OrderedDict的出現就是爲了解決這個問題:

from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)

Out:OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])

複製代碼

這回輸出時好多了,由於會自動記錄插入的順序,同理,若是咱們刪除一個key, OrderedDict的順序不會發生變化:

from collections import OrderedDict

print("Before deleting:\n")
od = OrderedDict()
od['a'] = 1
od['b'] = 2
od['c'] = 3
od['d'] = 4

for key, value in od.items():
    print(key, value)

print("\nAfter deleting:\n")
od.pop('c')
for key, value in od.items():
    print(key, value)

print("\nAfter re-inserting:\n")
od['c'] = 3
for key, value in od.items():
    print(key, value) 
    

Out:Before deleting:

    ('a', 1)
    ('b', 2)
    ('c', 3)
    ('d', 4)
    
    After deleting:
    
    ('a', 1)
    ('b', 2)
    ('d', 4)
    
    After re-inserting:
    
    ('a', 1)
    ('b', 2)
    ('d', 4)
    ('c', 3)
複製代碼

總結

今天爲你們簡單介紹了collections的一些基礎容器類型,包括:

容器類型 特色
defaultdict 找不到Key不會報錯的dict
counter 計數器,key爲出現的元素,value爲該元素出現的次數
deque 一個能夠雙向操做的list
namedtuple 用於建立具備命名字段的tuple
OrderedDict 記錄key輸入順序的dict

我以爲把它們叫作寶藏感受仍是不過度的,由於這些容器在真實使用場景中很是有用,並且我發現不少教程不會提到,所以衷心但願能夠幫到你們,若是我哪裏介紹有錯誤或者遺漏,但願你們留言指出,讓咱們一塊兒進步!

相關文章
相關標籤/搜索