Python實用技法第15篇:篩選序列中的元素

上一篇文章: Python實用技法第14篇:根據字段將記錄分組:itertools.groupby()
下一篇文章: Python實用技法第16篇:從字典中提取子集

一、需求🙀

序列中含有一些數據,咱們須要提取其中的值或根據某些標準對序列作刪減,

二、解決方案😸

要篩選序列中的數據,一般最簡單的方法是使用列表推導式。segmentfault

例如:函數

myList=[1,4,-5,10,-7,2,3,-1]
print([n for n in myList if n>0])
print([n for n in myList if n<0])

結果:工具

[1, 4, 10, 2, 3]
[-5, -7, -1]

使用列表推導式的一個潛在缺點是若是原始輸入很是大的話,這麼作可能會產生一個龐大的結果。若是這是你須要考慮的問題,那麼可使用生成器表達式經過迭代的方法產生篩選結果,例如:code

myList=[1,4,-5,10,-7,2,3,-1]
pos=(n for n in myList if n >0)
for x in pos:
    print(x)

結果:對象

1
4
10
2
3

有時候篩選的標準無法簡單地表示在列表推導式或生成器表達式中。好比:假設篩選過程涉及異常處理或者其餘一些複雜的細節。能夠將處理篩選邏輯的代碼放到單獨的函數中,而後使用內建的filter()函數處理,示例以下:get

values=['1','2','-3','-','4','N/A','5']
def is_int(val):
    try:
        x=int(val)
        return True
    except ValueError:
        return False

ivals=list(filter(is_int,values))
print(ivals)

結果:it

['1', '2', '-3', '4', '5']

filter()建立了一個迭代器,所以若是咱們想要的是列表形式的結果,請確保加上了list(),就像示例中那樣。import

三、分析

列表推導式和生成器表達式一般是用來篩選數據的最簡單和最直接的方式。此外,它們也具備同時對數據作轉換的能力。例如:List

import math
myList=[1,4,-5,10,-7,2,3,-1]
print([math.sqrt(n) for n in myList if n>0])

結果:迭代器

[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]

關於篩選數據,有一種狀況是用新值替換掉不知足標準的值,而不是拋棄它們。例如。除了要找到正整數以外,咱們也但願在指定範圍內將不知足要求的值替換掉。一般,這能夠經過將篩選條件遷移到一個條件表達式中來輕鬆實現,就像下面這樣:

myList=[1,4,-5,10,-7,2,3,-1]
print([n if n>0 else 0 for n in myList])
print([n if n<0 else 0 for n in myList])

結果:

[1, 4, 0, 10, 0, 2, 3, 0]
[0, 0, -5, 0, -7, 0, 0, -1]

另外一個值得一提的篩選工具是itertools.compress(),它接受一個可迭代對象以及一個布爾選擇器序列做爲輸入。輸出時,它會給出全部在相應的布爾選擇器中爲True的可迭代對象元素。若是想把對一個序列的篩選結果施加到另外一個相關的序列上時,這就會很是有用。

例如:

from itertools import compress
address=[
'5412 N CLARK1',
'5148 N CLARK2',
'5800 E CLARK3',
'2122 N CLARK4',
'5645 M CLARK5',
'1060 W CLARK6',
]
counts=[0,3,10,4,1,7]
#構建一個列表,它相應的count值要大於5
more5=[n>5 for n in counts]
print(more5)

print(list(compress(address,more5)))

結果:

[False, False, True, False, False, True]
['5800 E CLARK3', '1060 W CLARK6']

這裏的關鍵在於首先建立一個布爾序列,用來表示哪一個元素可知足咱們的條件,而後compress()函數挑選出知足布爾值爲True的相應元素。

同filter()函數同樣,正常狀況下,compress()會返回一個迭代器。所以,若是須要的話,得使用list()將結果轉爲列表。

上一篇文章: Python實用技法第14篇:根據字段將記錄分組:itertools.groupby()
下一篇文章: Python實用技法第16篇:從字典中提取子集
相關文章
相關標籤/搜索