順序表

時間 2020-05-26

標籤順序简体版

原文原文鏈接

1. 順序表介紹

2. 順序表的形式

3. 順序表的結構與實現

4. 順序表的操做

5. Python中的順序表

1. 順序表介紹

在程序中，常常須要將一組（一般是同爲某個類型的）數據元素做爲總體管理和使用，用變量記錄它們，傳進傳出函數等。一組數據中包含的元素個數可能發生變化（能夠增長或刪除元素）。數據結構

對於這種需求，最簡單的解決方案即是將這樣一組元素當作一個序列，用元素在序列裏的位置和順序，表示實際應用中的某種有意義的信息，或者表示數據之間的某種關係。app

這樣的一組序列元素的組織形式，咱們能夠將其抽象爲線性表。一個線性表是某類元素的一個集合，還記錄着元素之間的一種順序關係。函數

線性表是最基本的數據結構之一，在實際程序中應用很是普遍，它還常常被用做更復雜的數據結構的實現基礎。對象

根據線性表的實際存儲方式，分爲兩種實現模型：blog

順序表：將元素順序地存放在一塊連續的存儲區裏，元素間的順序關係由它們的存儲順序天然表示。
鏈表：將元素存放在經過連接構造起來的一系列存儲塊中。

2. 順序表的形式

圖a：基本順序表

圖a表示的是順序表的基本形式，數據元素自己連續存儲，每一個元素所佔的存儲單元大小固定相同，元素的下標是其邏輯地址，而元素存儲的物理地址（實際內存地址）能夠經過存儲區的起始地址 Loc(e0) 加上邏輯地址（第i個元素）與存儲單元大小（c）的乘積計算而得，即：索引

Loc(ei) = Loc(e0) + c*i內存

故，訪問指定元素時無需從頭遍歷，經過計算即可得到對應地址，其時間複雜度爲O(1)。資源

圖b：元素外圍順序表

若是元素的大小不統一，則須採用圖b的元素外置的形式，將實際數據元素另行存儲，而順序表中各單元位置保存對應元素的地址信息（即連接）。因爲每一個連接所需的存儲量相同，經過上述公式，能夠計算出元素連接的存儲位置，然後順着連接找到實際存儲的數據元素。注意，圖b中的c再也不是數據元素的大小，而是存儲一個連接地址所需的存儲量，這個量一般很小。效率

圖b這樣的順序表也被稱爲對實際數據的索引，這是最簡單的索引結構。基礎

3. 順序表的結構與實現

順序表的結構

一個順序表的完整信息包括兩部分：

一部分是表中的元素集合，即真實的數據區。
一部分是爲實現正確操做而需記錄的信息（表頭信息），即有關表的總體狀況的信息，這部分信息主要包括元素存儲區的容量和當前表中已有的元素個數兩項。

順序表的兩種基本實現方式

圖a：一體式結構

存儲表信息的單元與元素存儲區以連續的方式安排在一塊存儲區裏，兩部分數據的總體造成一個完整的順序表對象。

一體式結構總體性強，易於管理。可是因爲數據元素存儲區域是表對象的一部分，順序表建立後，元素存儲區就固定了。

圖b：分離式結構

表對象裏只保存與整個表有關的信息（即容量和元素個數），實際數據元素存放在另外一個獨立的元素存儲區裏，經過連接與基本表對象關聯。

元素存儲區替換

一體式結構因爲順序表信息區與數據區連續存儲在一塊兒，因此若想更換數據區，則只能總體搬遷，即整個順序表對象（指存儲順序表的結構信息的區域）改變了。

分離式結構若想更換數據區，只需將表信息區中的數據區連接地址更新便可，而該順序表對象不變。

元素存儲區擴充

採用分離式結構的順序表，若想將數據區更換爲存儲空間更大的區域，則能夠在不改變表對象的前提下對其數據存儲區進行擴充，全部使用這個表的地方都沒必要修改。只要程序的運行環境（計算機系統）還有空閒存儲，這種表結構就不會由於滿了而致使操做沒法進行。人們把採用這種技術實現的順序表稱爲動態順序表，由於其容量能夠在使用中動態變化。

擴充的兩種策略

線性增加

每次擴充增長固定數目的存儲位置，如每次擴充增長10個元素位置。
特色：節省空間，可是擴充操做頻繁，操做次數多。

倍數增加

每次擴充容量加倍，如每次擴充增長一倍存儲空間。
特色：減小了擴充操做的執行次數，但可能會浪費空間資源。以空間換時間，推薦的方式。

4. 順序表的操做

增長元素

如圖所示，爲順序表增長新元素 111 的三種方式：

a）尾端加入元素，時間複雜度爲O(1)

b）非保序的加入元素（不常見），時間複雜度爲O(1)

c）保序的元素加入，（最壞）時間複雜度爲O(n)

刪除元素

a）刪除表尾元素，時間複雜度爲O(1)

b）非保序的元素刪除（不常見），時間複雜度爲O(1)

c）保序的元素刪除，時間複雜度爲O(n)

5. Python中的順序表

Python中的list和tuple兩種類型採用了順序表的實現技術，具備前面討論的順序表的全部性質。

tuple是不可變類型，即不變的順序表，所以不支持改變其內部狀態的任何操做，而其餘方面，則與list的性質相似。

list的基本實現技術

Python標準類型list就是一種元素個數可變的線性表，能夠加入和刪除元素，並在各類操做中維持已有元素的順序（即保序），並且還具備如下行爲特徵：

1. 基於下標訪問

基於下標（位置）的高效元素訪問和更新，時間複雜度應該是O(1)；
爲知足該特徵，採用了順序表技術，表中元素保存在一塊連續的存儲區中。

2. 容許不斷加入元素，表對象的標識（函數id獲得的值）不變

爲知足該特徵，就必須能更換元素存儲區，而且爲保證更換存儲區時list對象的標識id不變，只能採用分離式結構的實現技術。

3. 容許元素類型不一致

爲知足該特徵，採用了元素外置的形式，由於存儲的地址連接所佔用的大小一致。

在Python的官方實現中，list就是一種採用分離式技術實現的動態順序表。這就是爲何用list.append(x)（或 list.insert(len(list), x)，即尾部插入）比在指定位置插入元素效率高的緣由。

在Python的官方實現中，list實現採用了以下的策略：在創建空表（或者很小的表）時，系統分配一塊能容納8個元素的存儲區。在執行插入操做（insert或append）時，若是元素存儲區滿就換一塊4倍大的存儲區。但若是此時的表已經很大（目前的閥值爲50000），則改變策略，採用加一倍的方法。引入這種改變策略的方式，是爲了不出現過多空閒的存儲位置。