1 python的set和其餘語言相似, 是一個無序不重複元素集, 基本功能包括關係測試和消除重複元素. 集合對象還支持union(聯合), intersection(交), difference(差)和sysmmetric difference(對稱差集)等數學運算. 2 3 sets 支持 x in set, len(set),和 for x in set。做爲一個無序的集合,sets不記錄元素位置或者插入點。所以,sets不支持 indexing, slicing, 或其它類序列(sequence-like)的操做。 4 5 6 7 下面來點簡單的小例子說明把。 8 9 >>> x = set('spam') 10 >>> y = set(['h','a','m']) 11 >>> x, y 12 (set(['a', 'p', 's', 'm']), set(['a', 'h', 'm'])) 13 14 再來些小應用。 15 16 >>> x & y # 交集 17 set(['a', 'm']) 18 19 >>> x | y # 並集 20 set(['a', 'p', 's', 'h', 'm']) 21 22 >>> x - y # 差集 23 set(['p', 's']) 24 25 記得之前個網友提問怎麼去除海量列表裏重複元素,用hash來解決也行,只不過感受在性能上不是很高,用set解決仍是很不錯的,示例以下: 26 27 >>> a = [11,22,33,44,11,22] 28 >>> b = set(a) 29 >>> b 30 set([33, 11, 44, 22]) 31 >>> c = [i for i in b] 32 >>> c 33 [33, 11, 44, 22] 34 35 很酷把,幾行就能夠搞定。 36 37 1.8 集合 38 39 集合用於包含一組無序的對象。要建立集合,可以使用set()函數並像下面這樣提供一系列的項: 40 41 42 43 s = set([3,5,9,10]) #建立一個數值集合 44 45 t = set("Hello") #建立一個惟一字符的集合 46 47 48 49 與列表和元組不一樣,集合是無序的,也沒法經過數字進行索引。此外,集合中的元素不能重複。例如,若是檢查前面代碼中t集合的值,結果會是: 50 51 52 53 >>> t 54 55 set(['H', 'e', 'l', 'o']) 56 57 58 59 注意只出現了一個'l'。 60 61 集合支持一系列標準操做,包括並集、交集、差集和對稱差集,例如: 62 63 64 65 a = t | s # t 和 s的並集 66 67 b = t & s # t 和 s的交集 68 69 c = t – s # 求差集(項在t中,但不在s中) 70 71 d = t ^ s # 對稱差集(項在t或s中,但不會同時出如今兩者中) 72 73 74 75 基本操做: 76 77 t.add('x') # 添加一項 78 79 s.update([10,37,42]) # 在s中添加多項 80 81 82 83 使用remove()能夠刪除一項: 84 85 t.remove('H') 86 87 88 89 len(s) 90 set 的長度 91 92 x in s 93 測試 x 是不是 s 的成員 94 95 x not in s 96 測試 x 是否不是 s 的成員 97 98 s.issubset(t) 99 s <= t 100 測試是否 s 中的每個元素都在 t 中 101 102 s.issuperset(t) 103 s >= t 104 測試是否 t 中的每個元素都在 s 中 105 106 s.union(t) 107 s | t 108 返回一個新的 set 包含 s 和 t 中的每個元素 109 110 s.intersection(t) 111 s & t 112 返回一個新的 set 包含 s 和 t 中的公共元素 113 114 s.difference(t) 115 s - t 116 返回一個新的 set 包含 s 中有可是 t 中沒有的元素 117 118 s.symmetric_difference(t) 119 s ^ t 120 返回一個新的 set 包含 s 和 t 中不重複的元素 121 122 s.copy() 123 返回 set 「s」的一個淺複製 124 125 126 請注意:union(), intersection(), difference() 和 symmetric_difference() 的非運算符(non-operator,就是形如 s.union()這樣的)版本將會接受任何 iterable 做爲參數。相反,它們的運算符版本(operator based counterparts)要求參數必須是 sets。這樣能夠避免潛在的錯誤,如:爲了更可讀而使用 set('abc') & 'cbs' 來替代 set('abc').intersection('cbs')。從 2.3.1 版本中作的更改:之前全部參數都必須是 sets。 127 128 另外,Set 和 ImmutableSet 二者都支持 set 與 set 之間的比較。兩個 sets 在也只有在這種狀況下是相等的:每個 set 中的元素都是另外一箇中的元素(兩者互爲subset)。一個 set 比另外一個 set 小,只有在第一個 set 是第二個 set 的 subset 時(是一個 subset,可是並不相等)。一個 set 比另外一個 set 打,只有在第一個 set 是第二個 set 的 superset 時(是一個 superset,可是並不相等)。 129 130 子 set 和相等比較並不產生完整的排序功能。例如:任意兩個 sets 都不相等也不互爲子 set,所以如下的運算都會返回 False:a<b, a==b, 或者a>b。所以,sets 不提供 __cmp__ 方法。 131 132 由於 sets 只定義了部分排序功能(subset 關係),list.sort() 方法的輸出對於 sets 的列表沒有定義。 133 134 135 運算符 136 運算結果 137 138 hash(s) 139 返回 s 的 hash 值 140 141 142 下面這個表列出了對於 Set 可用二對於 ImmutableSet 不可用的運算: 143 144 運算符(voperator) 145 等價於 146 運算結果 147 148 s.update(t) 149 s |= t 150 返回增長了 set 「t」中元素後的 set 「s」 151 152 s.intersection_update(t) 153 s &= t 154 返回只保留含有 set 「t」中元素的 set 「s」 155 156 s.difference_update(t) 157 s -= t 158 返回刪除了 set 「t」中含有的元素後的 set 「s」 159 160 s.symmetric_difference_update(t) 161 s ^= t 162 返回含有 set 「t」或者 set 「s」中有而不是二者都有的元素的 set 「s」 163 164 s.add(x) 165 166 向 set 「s」中增長元素 x 167 168 s.remove(x) 169 170 從 set 「s」中刪除元素 x, 若是不存在則引起 KeyError 171 172 s.discard(x) 173 174 若是在 set 「s」中存在元素 x, 則刪除 175 176 s.pop() 177 178 刪除而且返回 set 「s」中的一個不肯定的元素, 若是爲空則引起 KeyError 179 180 s.clear() 181 182 刪除 set 「s」中的全部元素 183 184 185 請注意:非運算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()將會接受任意 iterable 做爲參數。從 2.3.1 版本作的更改:之前全部參數都必須是 sets。 186 187 還請注意:這個模塊還包含一個 union_update() 方法,它是 update() 方法的一個別名。包含這個方法是爲了向後兼容。程序員們應該多使用 update() 方法,由於這個方法也被內置的 set() 和 frozenset() 類型支持。