關於高效使用Python字典的清單

時間 2019-11-16

原文原文鏈接

字典（dict）對象是 Python 最經常使用的數據結構，社區曾有人開玩笑地說："Python企圖用字典裝載整個世界"，字典在Python中的重要性不言而喻，這裏整理了幾個關於高效使用字典的清單，但願Python開發者能夠在平常應用開發中合理利用，讓代碼更加 Pythonic。html

一、用 in 關鍵字檢查 key 是否存在

Python之禪中有一條開發哲學是：python

There should be one-- and preferably only one --obvious way to do it.bash

儘可能找一種，最好是惟一種顯而易見的解決方案。Python2 中判斷某個 key 是否存在字典中可以使用 has_key 方法，另一種方式是使用 in 關鍵字。可是強烈推薦使用後者，由於 in 的處理速度更快，另一個緣由是 has_key 這個方法在 Python3 被移除了，要想同時兼容py2和py3兩個版本的代碼，用 in 是最好的選擇。數據結構

badapp

d = {'name': 'python'}

if d.has_key('name'):
    pass複製代碼

good函數

if 'name' in d:
    pass複製代碼

二、用 get 獲取字典中的值

關於獲取字典中的值，一種簡單的方式就是用d[x]訪問該元素，可是這種狀況在 key 不存在的狀況下會報 KeyError 錯誤，固然你能夠先用 in 操做檢查 key 是否在字典中再獲取，不過這種方式不符合 Python 之禪中說的：ui

Simple is better than complex.
Flat is better than nested.spa

好的代碼應該是簡單易懂的，扁平的代碼結構更加可讀。咱們可使用 get 方法來代替 if ... else.net

bad code

d = {'name': 'python'}
if 'name' in d:
    print(d['hello'])
else:
    print('default')複製代碼

good

print(d.get("name", "default"))複製代碼

三、用 setdefault 爲字典中不存在的 key 設置缺省值

data = [
        ("animal", "bear"),
        ("animal", "duck"),
        ("plant", "cactus"),
        ("vehicle", "speed boat"),
        ("vehicle", "school bus")
    ]複製代碼

在作分類統計時，但願把同一類型的數據歸到字典中的某種類型中，好比上面代碼，把相同類型的事物用列表的形式從新組裝，獲得新的字典

groups = {}

>>> 
{'plant': ['cactus'], 
 'animal': ['bear', 'duck'], 
 'vehicle': ['speed boat', 'school bus']}複製代碼

普通的方式就是先判斷 key 是否已經存在，若是不存在則要先用列表對象進行初始化，再執行後續操做。而更好的方式就是使用字典中的 setdefault 方法。

bad

for (key, value) in data:
    if key in groups:
        groups[key].append(value)
    else:
        groups[key] = [value]複製代碼

good

groups = {}
for (key, value) in data:
    groups.setdefault(key, []).append(value)複製代碼

setdefault 的做用是：

若是 key 存在於字典中，那麼直接返回對應的值，等效於 get 方法
若是 key 不存在字典中，則會用 setdefault 中的第二個參數做爲該 key 的值，再返回該值。

四、用 defaultdict 初始化字典對象

若是不但願 d[x] 在 x 不存在時報錯，除了在獲取元素時使用 get 方法以外，另一種方式是用 collections 模塊中的 defaultdict，在初始化字典的時候指定一個函數，其實 defaultdit 是 dict 的子類。

from collections import defaultdict

groups = defaultdict(list)
for (key, value) in data:
    groups[key].append(value)複製代碼

當 key 不存在於字典中時，list 函數將被調用並返回一個空列表賦值給 d[key]，這樣一來，你就不用擔憂調用 d[k] 會報錯了。

五、用 fromkeys 將列表轉換成字典

keys = {'a', 'e', 'i', 'o', 'u' }
value = []
d = dict.fromkeys(keys, value)
print(d)

>>>
{'i': [], 'u': [], 'e': [], 
 'a': [], 'o': []}複製代碼

六、用字典實現 switch ... case 語句

Python 中沒有 switch ... case 語句，這個問題Python之父龜叔表示這個語法過去沒有，如今沒有，之後也不會有。由於Python簡潔的語法徹底能夠用 if ... elif 實現。若是有太多的分支判斷，還可使用字典來代替。

if arg == 0:
    return 'zero'
elif arg == 1:
    return 'one'
elif arg == 2:
    return "two"
else:
    return "nothing"複製代碼

good

data = {
    0: "zero",
    1: "one",
    2: "two",
}
data.get(arg, "nothing")複製代碼

七、使用 iteritems 迭代字典中的元素

python提供了幾種方式迭代字典中的元素，第一種是使用 items 方法：

d = {
    0: "zero",
    1: "one",
    2: "two",
}

for k, v in d.items():
    print(k, v)複製代碼

items 方法返回的是（key ,value）組成的列表對象，這種方式的弊端是迭代超大字典的時候，內存瞬間會擴大兩倍，由於列表對象會一次性把全部元素加載到內存，更好的方式是使用 iteritems

for k, v in d.iteritems():
    print(k, v)複製代碼

iteritems 返回的是迭代器對象，迭代器對象具備惰性加載的特性，只有真正須要的時候才生成值，這種方式在迭代過程當中不須要額外的內存來裝載這些數據。注意 Python3 中，只有 items 方法了，它等價於 Python2 中的 iteritems，而 iteritems 這個方法名被移除了。

八、使用字典推導式

推導式是個絕妙的東西，列表推導式一出，map、filter等函數黯然失色，自 Python2.7之後的版本，此特性擴展到了字典和集合身上，構建字典對象無需調用 dict 方法。

bad

numbers = [1,2,3]
d = dict([(number,number*2) for number in numbers])複製代碼

good

numbers = [1, 2, 3]
d = {number: number * 2 for number in numbers}複製代碼

同步發表於：foofish.net/how-to-pyth…

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。