Python進階：切片的誤區與高級用法

時間 2019-12-06

原文原文鏈接

2018-12-31 更新聲明：切片系列文章本是分三篇寫成，現已合併成一篇。合併後，修正了一些嚴重的錯誤（如自定義序列切片的部分），還對行文結構與章節銜接作了大量改動。原系列的單篇就不刪除了，畢竟也是有單獨成篇的做用。特此聲明，請閱讀改進版—— Python進階：全面解讀高級特性之切片！https://mp.weixin.qq.com/s/IR...編程

衆所周知，咱們能夠經過索引值（或稱下標）來查找序列類型（如字符串、列表、元組...）中的單個元素，那麼，若是要獲取一個索引區間的元素該怎麼辦呢？數組

切片（slice）就是一種截取索引片斷的技術，藉助切片技術，咱們能夠十分靈活地處理序列類型的對象。一般來講，切片的做用就是截取序列對象，然而，它還有一些使用誤區與高級用法，都值得咱們注意。因此，本文將主要跟你們一塊兒來探討這些內容，但願你能學有所獲。微信

事先聲明，切片並不是列表的專屬操做，但由於列表最具備表明性，因此，本文僅以列表爲例做探討。數據結構

一、切片的基礎用法

列表是 Python 中極爲基礎且重要的一種數據結構，我曾寫過一篇彙總文章（連接見文末）較全面地學習過它。文中詳細地總結了切片的基礎用法，如今回顧一下：app

切片的書寫形式：[i : i+n : m] ；其中，i 是切片的起始索引值，爲列表首位時可省略；i+n 是切片的結束位置，爲列表末位時可省略；m 能夠不提供，默認值是1，不容許爲0 ，當m爲負數時，列表翻轉。注意：這些值均可以大於列表長度，不會報越界。編程語言

切片的基本含義是：從序列的第i位索引發，向右取到後n位元素爲止，按m間隔過濾 。學習

li = [1, 4, 5, 6, 7, 9, 11, 14, 16]

# 如下寫法均可以表示整個列表，其中 X >= len(li)
li[0:X] == li[0:] == li[:X] == li[:] == li[::] == li[-X:X] == li[-X:]

li[1:5] == [4,5,6,7] # 從1起，取5-1位元素
li[1:5:2] == [4,6] # 從1起，取5-1位元素，按2間隔過濾
li[-1:] == [16] # 取倒數第一個元素
li[-4:-2] == [9, 11] # 從倒數第四起，取-2-(-4)=2位元素
li[:-2] == li[-len(li):-2] == [1,4,5,6,7,9,11] # 從頭開始，取-2-(-len(li))=7位元素

# 步長爲負數時，列表先翻轉，再截取
li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻轉整個列表
li[::-2] == [16,11,7,5,1] # 翻轉整個列表，再按2間隔過濾
li[:-5:-1] == [16,14,11,9] # 翻轉整個列表，取-5-(-len(li))=4位元素
li[:-5:-3] == [16,9] # 翻轉整個列表，取-5-(-len(li))=4位元素，再按3間隔過濾

# 切片的步長不能夠爲0
li[::0]  # 報錯（ValueError: slice step cannot be zero）

上述的某些例子對於初學者（甚至不少老手）來講，可能還很差理解。我我的總結出兩條經驗：（1）緊緊記住公式[i : i+n : m] ，當出現缺省值時，經過想象把公式補全；（2）索引爲負且步長爲正時，按倒數計算索引位置；索引爲負且步長爲負時，先翻轉列表，再按倒數計算索引位置。spa

二、切片是僞獨立對象

切片操做的返回結果是一個新的獨立的序列（PS：也有例外，參見《Python是否支持複製字符串呢？》）。以列表爲例，列表切片後獲得的仍是一個列表，佔用新的內存地址。設計

當取出切片的結果時，它是一個獨立對象，所以，能夠將其用於賦值操做，也能夠用於其它傳遞值的場景。可是，切片只是淺拷貝，它拷貝的是原列表中元素的引用，因此，當存在變長對象的元素時，新列表將受制於原列表。code

li = [1, 2, 3, 4]
ls = li[::]

li == ls # True
id(li) == id(ls) # False
li.append(li[2:4]) # [1, 2, 3, 4, [3, 4]]
ls.extend(ls[2:4]) # [1, 2, 3, 4, 3, 4]

# 下例等價於判斷li長度是否大於8
if(li[8:]):
    print("not empty")
else:
    print("empty")

# 切片列表受制於原列表
lo = [1,[1,1],2,3]
lp = lo[:2] # [1, [1, 1]]
lo[1].append(1) # [1, [1, 1, 1], 2, 3]
lp # [1, [1, 1, 1]]

因爲可見，將切片結果取出，它能夠做爲獨立對象使用，可是也要注意，是否取出了變長對象的元素。

三、切片可做爲佔位符

切片既能夠做爲獨立對象被「取出」原序列，也能夠留在原序列，做爲一種佔位符使用。

在寫《詳解Python拼接字符串的七種方式》的時候，我介紹了幾種拼接字符串的方法，其中三種格式化類的拼接方法（即 %、format()、template）就是使用了佔位符的思想。對於列表來講，使用切片做爲佔位符，一樣可以實現拼接列表的效果。特別須要注意的是，給切片賦值的必須是可迭代對象。

li = [1, 2, 3, 4]

# 在頭部拼接
li[:0] = [0] # [0, 1, 2, 3, 4]
# 在末尾拼接
li[len(li):] = [5,7] # [0, 1, 2, 3, 4, 5, 7]
# 在中部拼接
li[6:6] = [6] # [0, 1, 2, 3, 4, 5, 6, 7]

# 給切片賦值的必須是可迭代對象
li[-1:-1] = 6 # （報錯，TypeError: can only assign an iterable）
li[:0] = (9,) #  [9, 0, 1, 2, 3, 4, 5, 6, 7]
li[:0] = range(3) #  [0, 1, 2, 9, 0, 1, 2, 3, 4, 5, 6, 7]

上述例子中，若將切片做爲獨立對象取出，那你會發現它們都是空列表，即 li[:0]==li[len(li):]==li[6:6]==[] ，我將這種佔位符稱爲「純佔位符」，對純佔位符賦值，並不會破壞原有的元素，只會在特定的索引位置中拼接進新的元素。刪除純佔位符時，也不會影響列表中的元素。

與「純佔位符」相對應，「非純佔位符」的切片是非空列表，對它進行操做（賦值與刪除），將會影響原始列表。若是說純佔位符能夠實現列表的拼接，那麼，非純佔位符能夠實現列表的替換。

li = [1, 2, 3, 4]

# 不一樣位置的替換
li[:3] = [7,8,9] # [7, 8, 9, 4]
li[3:] = [5,6,7] # [7, 8, 9, 5, 6, 7]
li[2:4] = ['a','b'] # [7, 8, 'a', 'b', 6, 7]

# 非等長替換
li[2:4] = [1,2,3,4] # [7, 8, 1, 2, 3, 4, 6, 7]
li[2:6] = ['a']  # [7, 8, 'a', 6, 7]

# 刪除元素
del li[2:3] # [7, 8, 6, 7]

切片佔位符能夠帶步長，從而實現連續跨越性的替換或刪除效果。須要注意的是，這種用法只支持等長替換。

li = [1, 2, 3, 4, 5, 6]

li[::2] = ['a','b','c'] # ['a', 2, 'b', 4, 'c', 6]
li[::2] = [0]*3 # [0, 2, 0, 4, 0, 6]
li[::2] = ['w'] # 報錯，attempt to assign sequence of size 1 to extended slice of size 3

del li[::2] # [2, 4, 6]

四、更多思考

其它編程語言是否有相似於 Python 的切片操做呢？有什麼差別？

我在交流羣裏問了這個問題，小夥伴們紛紛說 Java、Go、Ruby......在查看相關資料的時候，我發現 Go 語言的切片是挺奇怪的設計。首先，它是一種特殊類型，即對數組（array）作切片後，獲得的居然不是一個數組；其次，你能夠建立和初始化一個切片，須要聲明長度（len）和容量（cap）；再者，它還存在超出底層數組的界限而須要進行擴容的動態機制，這卻是跟 Python 列表的超額分配機制有必定類似性......

在我看來，不管是用意，仍是寫法和用法，都是 Python 的切片操做更明瞭與好用。因此，本文就再也不進行跨編程語言的比較了（唔，好吧我認可，實際上是我不怎麼懂其它編程語言......）

最後，還有一個問題：Python 的切片操做有什麼底層原理呢？ 咱們是否能夠自定義切片操做呢？限於篇幅，我將在下次推文中跟你們一塊兒學習，敬請期待。

延伸閱讀 ：

超強彙總：學習Python列表，只需這篇文章就夠了

詳解Python拼接字符串的七種方式

Python是否支持複製字符串呢？

PS：本公衆號（Python貓）已開通讀者交流羣，詳情請經過菜單欄中的「交流羣」瞭解。

-----------------

本文原創並首發於微信公衆號【Python貓】，後臺回覆「愛學習」，免費得到20+本精選電子書。