數據結構與算法（一）：帶你瞭解時間複雜度和空間複雜度究竟是什麼？

時間 2020-05-21

標籤數據結構算法瞭解時間複雜度空間究竟什麼简体版

原文原文鏈接

1. 前言

算法（Algorithm）是指用來操做數據、解決程序問題的一組方法。對於同一個問題，使用不一樣的算法，也許最終獲得的結果是同樣的，但在過程當中消耗的資源和時間卻會有很大的區別。那麼咱們應該如何去衡量不一樣算法之間的優劣呢？面試

主要仍是從算法所佔用的「時間」和「空間」兩個維度去考量。redis

時間維度：是指執行當前算法所消耗的時間，咱們一般用「時間複雜度」來描述。
空間維度：是指執行當前算法須要佔用多少內存空間，咱們一般用「空間複雜度」來描述。

所以，評價一個算法的效率主要是看它的時間複雜度和空間複雜度狀況。然而，有的時候時間和空間卻又是「魚和熊掌」，不可兼得的，那麼咱們就須要從中去取一個平衡點。算法

2. 算法的介紹

排序也稱排序算法(Sort Algorithm)，排序是將一組數據，依指定的順序進行排列的過程。編程

3. 排序的分類

3.1 內部排序

指將須要處理的全部數據都加載到內部存儲器(內存)中進行排序。數組

3.2 外部排序法

數據量過大，沒法所有加載到內存中，須要藉助外部存儲(文件等)進行排序。緩存

3.3 常見的排序算法分類(見下圖)

4. 算法的時間複雜度

4.1 度量程序(算法)執行時間方法

4.1.1 過後統計的方法

這種方法可行, 可是有兩個問題：一是要想對設計的算法的運行性能進行評測，須要實際運行該程序；二是所得時間的統計量依賴於計算機的硬件、軟件等環境因素, 這種方式，要在同一臺計算機的相同狀態下運行，才能比較哪一個算法速度更快。微信

4.1.2 事前估算的方法

因過後統計方法更多的依賴於計算機的硬件、軟件等環境因素，有時容易掩蓋算法自己的優劣。所以人們經常採用事前分析估算的方法。
在編寫程序前，依據統計方法對算法進行估算。一個用高級語言編寫的程序在計算機上運行時所消耗的時間取決於下列因素：
(1) 算法採用的策略、方法
(2) 編譯產生的代碼質量
(3) 問題的輸入規模
(4) 機器執行指令的速度。函數

經過分析某個算法的時間複雜度來判斷哪一個算法更優。性能

4.2 時間頻度

4.2.1 基本介紹

時間頻度：一個算法花費的時間與算法中語句的執行次數成正比例，哪一個算法中語句執行次數多，它花費時間就多。一個算法中的語句執行次數稱爲語句頻度或時間頻度。記爲 T(n)。學習

舉例說明-基本案例

好比計算 1-1000 全部數字之和, 咱們設計兩種算法：

舉例說明-忽略常數項

結論:
1) 2n+20 和 2n 隨着 n 變大，執行曲線無限接近, 20 能夠忽略
2) 3n+10 和 3n 隨着 n 變大，執行曲線無限接近, 10 能夠忽略

舉例說明-忽略低次項

結論:
1) 2n^2+3n+10 和 2n^2 隨着 n 變大, 執行曲線無限接近, 能夠忽略 3n+10
2) n^2+5n+20 和 n^2 隨着 n 變大,執行曲線無限接近, 能夠忽略 5n+20

舉例說明-忽略係數

結論:
1) 隨着 n 值變大，5n^2+7n 和 3n^2 + 2n ，執行曲線重合, 說明這種狀況下, 5 和 3 能夠忽略。
2) 而 n^3+5n 和 6n^3+4n ，執行曲線分離，說明多少次方式關鍵

4.3 時間複雜度

1) 通常狀況下，算法中的基本操做語句的重複執行次數是問題規模 n 的某個函數，用 T(n)表示，如有某個輔助函數 f(n)，使得當 n 趨近於無窮大時，T(n) / f(n) 的極限值爲不等於零的常數，則稱 f(n)是 T(n)的同數量級函數。記做 T(n)= Ｏ( f(n) )，稱Ｏ( f(n) ) 爲算法的漸進時間複雜度，簡稱時間複雜度。
2) T(n) 不一樣，但時間複雜度可能相同。如：T(n)=n²+7n+6 與 T(n)=3n²+2n+2 它們的 T(n) 不一樣，但時間複雜度相同，都爲 O(n²)。
3) 計算時間複雜度的方法：

用常數 1 代替運行時間中的全部加法常數 T(n)=n²+7n+6 => T(n)=n²+7n+1
修改後的運行次數函數中，只保留最高階項 T(n)=n²+7n+1 => T(n) = n²
去除最高階項的係數 T(n) = n² => T(n) = n² => O(n²)

4.4 常見的時間複雜度

1) 常數階 O(1)
2) 對數階 O(log2n)
3) 線性階 O(n)
4) 線性對數階 O(nlog2n)
5) 平方階 O(n^2)
6) 立方階 O(n^3)
7) k 次方階 O(n^k)
8) 指數階 O(2^n)

4.4.1 常見的時間複雜度對應的圖

說明：

1) 常見的算法時間複雜度由小到大依次爲：Ο(1)＜Ο(log2n)＜Ο(n)＜Ο(nlog2n)＜Ο(n2)＜Ο(n3)＜Ο(nk)＜Ο(2n) ，隨着問題規模 n 的不斷增大，上述時間複雜度不斷增大，算法的執行效率越低
2) 從圖中可見，咱們應該儘量避免使用指數階的算法

4.4.1.1 常數階 O(1)

不管代碼執行了多少行，只要是沒有循環等複雜結構，那這個代碼的時間複雜度就都是O(1)。

上述代碼在執行的時候，它消耗的時候並不隨着某個變量的增加而增加，那麼不管這類代碼有多長，即便有幾萬幾十萬行，均可以用O(1)來表示它的時間複雜度。

4.4.1.2 對數階 O(log2n)

說明： 在while循環裏面，每次都將 i 乘以 2，乘完以後，i 距離 n 就愈來愈近了。假設循環x次以後，i 就大於 n 了，此時這個循環就退出了，也就是說 2 的 x 次方等於 n，那麼 x = log2n也就是說當循環 log2n 次之後，這個代碼就結束了。所以這個代碼的時間複雜度爲：O(log2n) 。 O(log2n) 的這個2 時間上是根據代碼變化的，i = i * 3 ，則是 O(log3n) 。

4.4.1.3 線性階 O(n)

說明： 這段代碼，for循環裏面的代碼會執行n遍，所以它消耗的時間是隨着n的變化而變化的，所以這類代碼均可以用O(n)來表示它的時間複雜度。

4.4.1.4 線性對數階 O(nlogN)

說明： 線性對數階O(nlogN) 其實很是容易理解，將時間複雜度爲O(logn)的代碼循環N遍的話，那麼它的時間複雜度就是 n * O(logN)，也就是了O(nlogN)。

4.4.1.5 平方階 O(n²)

說明： 平方階O(n²) 就更容易理解了，若是把 O(n) 的代碼再嵌套循環一遍，它的時間複雜度就是 O(n²)，這段代碼其實就是嵌套了2層n循環，它的時間複雜度就是 O(nn)，即 O(n²) 若是將其中一層循環的n改爲m，那它的時間複雜度就變成了 O(mn)

4.4.1.6 立方階 O(n³)、K 次方階 O(n^k)

說明： 參考上面的 O(n²) 去理解就行了，O(n³)至關於三層 n 循環，其它的相似

4.5 平均時間複雜度和最壞時間複雜度

1) 平均時間複雜度是指全部可能的輸入實例均以等機率出現的狀況下，該算法的運行時間。

2) 最壞狀況下的時間複雜度稱最壞時間複雜度。通常討論的時間複雜度均是最壞狀況下的時間複雜度。這樣作的緣由是：最壞狀況下的時間複雜度是算法在任何輸入實例上運行時間的界限，這就保證了算法的運行時間不會比最壞狀況更長。

3) 平均時間複雜度和最壞時間複雜度是否一致，和算法有關(以下圖)。

4. 空間複雜度

4.1 簡介

1) 相似於時間複雜度的討論，一個算法的空間複雜度(Space Complexity)定義爲該算法所耗費的存儲空間，它也是問題規模 n 的函數。
2) 空間複雜度(Space Complexity)是對一個算法在運行過程當中臨時佔用存儲空間大小的量度。有的算法須要佔用的臨時工做單元數與解決問題的規模 n 有關，它隨着 n 的增大而增大，當 n 較大時，將佔用較多的存儲單元，例如快速排序和歸併排序算法, 基數排序就屬於這種狀況
3) 在作算法分析時，主要討論的是時間複雜度。 從用戶使用體驗上看，更看重的程序執行的速度。一些緩存產品(redis, memcache)和算法(基數排序)本質就是用空間換時間。