JavaScript 數據結構與算法之美 - 十大經典排序算法彙總

圖片描述

1. 前言

算法爲王。

想學好前端,先練好內功,內功不行,就算招式練的再花哨,終究成不了高手;只有內功深厚者,前端之路纔會走得更遠。javascript

筆者寫的 JavaScript 數據結構與算法之美 系列用的語言是 JavaScript ,旨在入門數據結構與算法和方便之後複習。html

文中包含了 十大經典排序算法 的思想、代碼實現、一些例子、複雜度分析、動畫、還有算法可視化工具。前端

這應該是目前較爲簡單的 JavaScript 十大經典排序算法 的文章講解了吧。java

2. 如何分析一個排序算法

複雜度分析是整個算法學習的精髓。git

  • 時間複雜度: 一個算法執行所耗費的時間。
  • 空間複雜度: 運行完一個程序所需內存的大小。

時間和空間複雜度的詳解,請看 JavaScript 數據結構與算法之美 - 時間和空間複雜度github

學習排序算法,咱們除了學習它的算法原理、代碼實現以外,更重要的是要學會如何評價、分析一個排序算法。算法

分析一個排序算法,要從 執行效率內存消耗穩定性 三方面入手。shell

2.1 執行效率

1. 最好狀況、最壞狀況、平均狀況時間複雜度segmentfault

咱們在分析排序算法的時間複雜度時,要分別給出最好狀況、最壞狀況、平均狀況下的時間複雜度。
除此以外,你還要說出最好、最壞時間複雜度對應的要排序的原始數據是什麼樣的。api

2. 時間複雜度的係數、常數 、低階

咱們知道,時間複雜度反應的是數據規模 n 很大的時候的一個增加趨勢,因此它表示的時候會忽略係數、常數、低階。

可是實際的軟件開發中,咱們排序的多是 10 個、100 個、1000 個這樣規模很小的數據,因此,在對同一階時間複雜度的排序算法性能對比的時候,咱們就要把係數、常數、低階也考慮進來。

3. 比較次數和交換(或移動)次數

這一節和下一節講的都是基於比較的排序算法。基於比較的排序算法的執行過程,會涉及兩種操做,一種是元素比較大小,另外一種是元素交換或移動。

因此,若是咱們在分析排序算法的執行效率的時候,應該把比較次數和交換(或移動)次數也考慮進去。

2.2 內存消耗

也就是看空間複雜度。

還須要知道以下術語:

  • 內排序:全部排序操做都在內存中完成;
  • 外排序:因爲數據太大,所以把數據放在磁盤中,而排序經過磁盤和內存的數據傳輸才能進行;
  • 原地排序:原地排序算法,就是特指空間複雜度是 O(1) 的排序算法。

2.3 穩定性

  • 穩定:若是待排序的序列中存在值相等的元素,通過排序以後,相等元素之間原有的前後順序不變

好比: a 本來在 b 前面,而 a = b,排序以後,a 仍然在 b 的前面;

  • 不穩定:若是待排序的序列中存在值相等的元素,通過排序以後,相等元素之間原有的前後順序改變

好比:a 本來在 b 的前面,而 a = b,排序以後, a 在 b 的後面;

3. 十大經典排序算法

3.1 冒泡排序(Bubble Sort)

strip

思想

  • 冒泡排序只會操做相鄰的兩個數據。
  • 每次冒泡操做都會對相鄰的兩個元素進行比較,看是否知足大小關係要求。若是不知足就讓它倆互換。
  • 一次冒泡會讓至少一個元素移動到它應該在的位置,重複 n 次,就完成了 n 個數據的排序工做。

特色

  • 優勢:排序算法的基礎,簡單實用易於理解。
  • 缺點:比較次數多,效率較低。

實現

// 冒泡排序(未優化)
const bubbleSort = arr => {
    console.time('改進前冒泡排序耗時');
    const length = arr.length;
    if (length <= 1) return;
    // i < length - 1 是由於外層只須要 length-1 次就排好了,第 length 次比較是多餘的。
    for (let i = 0; i < length - 1; i++) {
        // j < length - i - 1 是由於內層的 length-i-1 到 length-1 的位置已經排好了,不須要再比較一次。
        for (let j = 0; j < length - i - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                const temp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = temp;
            }
        }
    }
    console.log('改進前 arr :', arr);
    console.timeEnd('改進前冒泡排序耗時');
};

優化:當某次冒泡操做已經沒有數據交換時,說明已經達到徹底有序,不用再繼續執行後續的冒泡操做。

// 冒泡排序(已優化)
const bubbleSort2 = arr => {
    console.time('改進後冒泡排序耗時');
    const length = arr.length;
    if (length <= 1) return;
    // i < length - 1 是由於外層只須要 length-1 次就排好了,第 length 次比較是多餘的。
    for (let i = 0; i < length - 1; i++) {
        let hasChange = false; // 提早退出冒泡循環的標誌位
        // j < length - i - 1 是由於內層的 length-i-1 到 length-1 的位置已經排好了,不須要再比較一次。
        for (let j = 0; j < length - i - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                const temp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = temp;
                hasChange = true; // 表示有數據交換
            }
        }

        if (!hasChange) break; // 若是 false 說明全部元素已經到位,沒有數據交換,提早退出
    }
    console.log('改進後 arr :', arr);
    console.timeEnd('改進後冒泡排序耗時');
};

測試

// 測試
const arr = [7, 8, 4, 5, 6, 3, 2, 1];
bubbleSort(arr);
// 改進前 arr : [1, 2, 3, 4, 5, 6, 7, 8]
// 改進前冒泡排序耗時: 0.43798828125ms

const arr2 = [7, 8, 4, 5, 6, 3, 2, 1];
bubbleSort2(arr2);
// 改進後 arr : [1, 2, 3, 4, 5, 6, 7, 8]
// 改進後冒泡排序耗時: 0.318115234375ms

分析

  • 第一,冒泡排序是原地排序算法嗎 ?

冒泡的過程只涉及相鄰數據的交換操做,只須要常量級的臨時空間,因此它的空間複雜度爲 O(1),是一個原地排序算法。

  • 第二,冒泡排序是穩定的排序算法嗎 ?

在冒泡排序中,只有交換才能夠改變兩個元素的先後順序。
爲了保證冒泡排序算法的穩定性,當有相鄰的兩個元素大小相等的時候,咱們不作交換,相同大小的數據在排序先後不會改變順序。
因此冒泡排序是穩定的排序算法。

  • 第三,冒泡排序的時間複雜度是多少 ?

最佳狀況:T(n) = O(n),當數據已是正序時。
最差狀況:T(n) = O(n2),當數據是反序時。
平均狀況:T(n) = O(n2)。

動畫

strip

strip

3.2 插入排序(Insertion Sort)

插入排序又爲分爲 直接插入排序 和優化後的 拆半插入排序希爾排序,咱們一般說的插入排序是指直接插入排序。

1、直接插入

思想

通常人打撲克牌,整理牌的時候,都是按牌的大小(從小到大或者從大到小)整理牌的,那每摸一張新牌,就掃描本身的牌,把新牌插入到相應的位置。

插入排序的工做原理:經過構建有序序列,對於未排序數據,在已排序序列中從後向前掃描,找到相應位置並插入。

步驟

  • 從第一個元素開始,該元素能夠認爲已經被排序;
  • 取出下一個元素,在已經排序的元素序列中從後向前掃描;
  • 若是該元素(已排序)大於新元素,將該元素移到下一位置;
  • 重複步驟 3,直到找到已排序的元素小於或者等於新元素的位置;
  • 將新元素插入到該位置後;
  • 重複步驟 2 ~ 5。

實現

// 插入排序
const insertionSort = array => {
    const len = array.length;
    if (len <= 1) return

    let preIndex, current;
    for (let i = 1; i < len; i++) {
        preIndex = i - 1; //待比較元素的下標
        current = array[i]; //當前元素
        while (preIndex >= 0 && array[preIndex] > current) {
            //前置條件之一: 待比較元素比當前元素大
            array[preIndex + 1] = array[preIndex]; //將待比較元素後移一位
            preIndex--; //遊標前移一位
        }
        if (preIndex + 1 != i) {
            //避免同一個元素賦值給自身
            array[preIndex + 1] = current; //將當前元素插入預留空位
            console.log('array :', array);
        }
    }
    return array;
};

測試

// 測試
const array = [5, 4, 3, 2, 1];
console.log("原始 array :", array);
insertionSort(array);
// 原始 array:    [5, 4, 3, 2, 1]
// array:           [4, 5, 3, 2, 1]
// array:           [3, 4, 5, 2, 1]
// array:          [2, 3, 4, 5, 1]
// array:           [1, 2, 3, 4, 5]

分析

  • 第一,插入排序是原地排序算法嗎 ?

插入排序算法的運行並不須要額外的存儲空間,因此空間複雜度是 O(1),因此,這是一個原地排序算法。

  • 第二,插入排序是穩定的排序算法嗎 ?

在插入排序中,對於值相同的元素,咱們能夠選擇將後面出現的元素,插入到前面出現元素的後面,這樣就能夠保持原有的先後順序不變,因此插入排序是穩定的排序算法。

  • 第三,插入排序的時間複雜度是多少 ?

最佳狀況:T(n) = O(n),當數據已是正序時。
最差狀況:T(n) = O(n2),當數據是反序時。
平均狀況:T(n) = O(n2)。

動畫

strip

2、拆半插入

插入排序也有一種優化算法,叫作拆半插入

思想

折半插入排序是直接插入排序的升級版,鑑於插入排序第一部分爲已排好序的數組,咱們沒必要按順序依次尋找插入點,只需比較它們的中間值與待插入元素的大小便可。

步驟

  • 取 0 ~ i-1 的中間點 ( m = (i-1) >> 1 ),array[i] 與 array[m] 進行比較,若 array[i] < array[m],則說明待插入的元素 array[i] 應該處於數組的 0 ~ m 索引之間;反之,則說明它應該處於數組的 m ~ i-1 索引之間。
  • 重複步驟 1,每次縮小一半的查找範圍,直至找到插入的位置。
  • 將數組中插入位置以後的元素所有後移一位。
  • 在指定位置插入第 i 個元素。
注:x >> 1 是位運算中的右移運算,表示右移一位,等同於 x 除以 2 再取整,即 x >> 1 == Math.floor(x/2) 。
// 折半插入排序
const binaryInsertionSort = array => {
    const len = array.length;
    if (len <= 1) return;

    let current, i, j, low, high, m;
    for (i = 1; i < len; i++) {
        low = 0;
        high = i - 1;
        current = array[i];

        while (low <= high) {
            //步驟 1 & 2 : 折半查找
            m = (low + high) >> 1; // 注: x>>1 是位運算中的右移運算, 表示右移一位, 等同於 x 除以 2 再取整, 即 x>>1 == Math.floor(x/2) .
            if (array[i] >= array[m]) {
                //值相同時, 切換到高半區,保證穩定性
                low = m + 1; //插入點在高半區
            } else {
                high = m - 1; //插入點在低半區
            }
        }
        for (j = i; j > low; j--) {
            //步驟 3: 插入位置以後的元素所有後移一位
            array[j] = array[j - 1];
            console.log('array2 :', JSON.parse(JSON.stringify(array)));
        }
        array[low] = current; //步驟 4: 插入該元素
    }
    console.log('array2 :', JSON.parse(JSON.stringify(array)));
    return array;
};

測試

const array2 = [5, 4, 3, 2, 1];
console.log('原始 array2:', array2);
binaryInsertionSort(array2);
// 原始 array2:  [5, 4, 3, 2, 1]
// array2 :     [5, 5, 3, 2, 1]
// array2 :     [4, 5, 5, 2, 1]
// array2 :     [4, 4, 5, 2, 1]
// array2 :     [3, 4, 5, 5, 1]
// array2 :     [3, 4, 4, 5, 1]
// array2 :     [3, 3, 4, 5, 1]
// array2 :     [2, 3, 4, 5, 5]
// array2 :     [2, 3, 4, 4, 5]
// array2 :     [2, 3, 3, 4, 5]
// array2 :     [2, 2, 3, 4, 5]
// array2 :     [1, 2, 3, 4, 5]

注意:和直接插入排序相似,折半插入排序每次交換的是相鄰的且值爲不一樣的元素,它並不會改變值相同的元素之間的順序,所以它是穩定的。

3、希爾排序

希爾排序是一個平均時間複雜度爲 O(n log n) 的算法,會在下一個章節和 歸併排序、快速排序、堆排序 一塊兒講,本文就不展開了。

3.3 選擇排序(Selection Sort)

思路

選擇排序算法的實現思路有點相似插入排序,也分已排序區間和未排序區間。可是選擇排序每次會從未排序區間中找到最小的元素,將其放到已排序區間的末尾。

步驟

  1. 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置。
  2. 再從剩餘未排序元素中繼續尋找最小(大)元素,而後放到已排序序列的末尾。
  3. 重複第二步,直到全部元素均排序完畢。

實現

const selectionSort = array => {
    const len = array.length;
    let minIndex, temp;
    for (let i = 0; i < len - 1; i++) {
        minIndex = i;
        for (let j = i + 1; j < len; j++) {
            if (array[j] < array[minIndex]) {
                // 尋找最小的數
                minIndex = j; // 將最小數的索引保存
            }
        }
        temp = array[i];
        array[i] = array[minIndex];
        array[minIndex] = temp;
        console.log('array: ', array);
    }
    return array;
};

測試

// 測試
const array = [5, 4, 3, 2, 1];
console.log('原始array:', array);
selectionSort(array);
// 原始 array:  [5, 4, 3, 2, 1]
// array:           [1, 4, 3, 2, 5]
// array:           [1, 2, 3, 4, 5]
// array:          [1, 2, 3, 4, 5]
// array:           [1, 2, 3, 4, 5]

分析

  • 第一,選擇排序是原地排序算法嗎 ?

選擇排序空間複雜度爲 O(1),是一種原地排序算法。

  • 第二,選擇排序是穩定的排序算法嗎 ?

選擇排序每次都要找剩餘未排序元素中的最小值,並和前面的元素交換位置,這樣破壞了穩定性。因此,選擇排序是一種不穩定的排序算法。

  • 第三,選擇排序的時間複雜度是多少 ?

不管是正序仍是逆序,選擇排序都會遍歷 n2 / 2 次來排序,因此,最佳、最差和平均的複雜度是同樣的。
最佳狀況:T(n) = O(n2)。
最差狀況:T(n) = O(n2)。
平均狀況:T(n) = O(n2)。

動畫

selection-sort.gif

3.4 歸併排序(Merge Sort)

思想

排序一個數組,咱們先把數組從中間分紅先後兩部分,而後對先後兩部分分別排序,再將排好序的兩部分合並在一塊兒,這樣整個數組就都有序了。

歸併排序採用的是分治思想

分治,顧名思義,就是分而治之,將一個大問題分解成小的子問題來解決。小的子問題解決了,大問題也就解決了。

clipboard.png

注:x >> 1 是位運算中的右移運算,表示右移一位,等同於 x 除以 2 再取整,即 x >> 1 === Math.floor(x / 2) 。

實現

const mergeSort = arr => {
    //採用自上而下的遞歸方法
    const len = arr.length;
    if (len < 2) {
        return arr;
    }
    // length >> 1 和 Math.floor(len / 2) 等價
    let middle = Math.floor(len / 2),
        left = arr.slice(0, middle),
        right = arr.slice(middle); // 拆分爲兩個子數組
    return merge(mergeSort(left), mergeSort(right));
};

const merge = (left, right) => {
    const result = [];

    while (left.length && right.length) {
        // 注意: 判斷的條件是小於或等於,若是隻是小於,那麼排序將不穩定.
        if (left[0] <= right[0]) {
            result.push(left.shift());
        } else {
            result.push(right.shift());
        }
    }

    while (left.length) result.push(left.shift());

    while (right.length) result.push(right.shift());

    return result;
};

測試

// 測試
const arr = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48];
console.time('歸併排序耗時');
console.log('arr :', mergeSort(arr));
console.timeEnd('歸併排序耗時');
// arr : [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
// 歸併排序耗時: 0.739990234375ms

分析

  • 第一,歸併排序是原地排序算法嗎 ?

這是由於歸併排序的合併函數,在合併兩個有序數組爲一個有序數組時,須要藉助額外的存儲空間。
實際上,儘管每次合併操做都須要申請額外的內存空間,但在合併完成以後,臨時開闢的內存空間就被釋放掉了。在任意時刻,CPU 只會有一個函數在執行,也就只會有一個臨時的內存空間在使用。臨時內存空間最大也不會超過 n 個數據的大小,因此空間複雜度是 O(n)。
因此,歸併排序不是原地排序算法。

  • 第二,歸併排序是穩定的排序算法嗎 ?

merge 方法裏面的 left[0] <= right[0] ,保證了值相同的元素,在合併先後的前後順序不變。歸併排序是穩定的排序方法。

  • 第三,歸併排序的時間複雜度是多少 ?

從效率上看,歸併排序可算是排序算法中的佼佼者。假設數組長度爲 n,那麼拆分數組共需 logn 步,又每步都是一個普通的合併子數組的過程,時間複雜度爲 O(n),故其綜合時間複雜度爲 O(n log n)。
最佳狀況:T(n) = O(n log n)。
最差狀況:T(n) = O(n log n)。
平均狀況:T(n) = O(n log n)。

動畫

strip

3.5 快速排序 (Quick Sort)

快速排序的特色就是快,並且效率高!它是處理大數據最快的排序算法之一。

思想

  • 先找到一個基準點(通常指數組的中部),而後數組被該基準點分爲兩部分,依次與該基準點數據比較,若是比它小,放左邊;反之,放右邊。
  • 左右分別用一個空數組去存儲比較後的數據。
  • 最後遞歸執行上述操做,直到數組長度 <= 1;

特色:快速,經常使用。

缺點:須要另外聲明兩個數組,浪費了內存空間資源。

實現

方法一:

const quickSort1 = arr => {
    if (arr.length <= 1) {
        return arr;
    }
    //取基準點
    const midIndex = Math.floor(arr.length / 2);
    //取基準點的值,splice(index,1) 則返回的是含有被刪除的元素的數組。
    const valArr = arr.splice(midIndex, 1);
    const midIndexVal = valArr[0];
    const left = []; //存放比基準點小的數組
    const right = []; //存放比基準點大的數組
    //遍歷數組,進行判斷分配
    for (let i = 0; i < arr.length; i++) {
        if (arr[i] < midIndexVal) {
            left.push(arr[i]); //比基準點小的放在左邊數組
        } else {
            right.push(arr[i]); //比基準點大的放在右邊數組
        }
    }
    //遞歸執行以上操做,對左右兩個數組進行操做,直到數組長度爲 <= 1
    return quickSort1(left).concat(midIndexVal, quickSort1(right));
};
const array2 = [5, 4, 3, 2, 1];
console.log('quickSort1 ', quickSort1(array2));
// quickSort1: [1, 2, 3, 4, 5]

方法二:

// 快速排序
const quickSort = (arr, left, right) => {
    let len = arr.length,
        partitionIndex;
    left = typeof left != 'number' ? 0 : left;
    right = typeof right != 'number' ? len - 1 : right;

    if (left < right) {
        partitionIndex = partition(arr, left, right);
        quickSort(arr, left, partitionIndex - 1);
        quickSort(arr, partitionIndex + 1, right);
    }
    return arr;
};

const partition = (arr, left, right) => {
    //分區操做
    let pivot = left, //設定基準值(pivot)
        index = pivot + 1;
    for (let i = index; i <= right; i++) {
        if (arr[i] < arr[pivot]) {
            swap(arr, i, index);
            index++;
        }
    }
    swap(arr, pivot, index - 1);
    return index - 1;
};

const swap = (arr, i, j) => {
    let temp = arr[i];
    arr[i] = arr[j];
    arr[j] = temp;
};

測試

// 測試
const array = [5, 4, 3, 2, 1];
console.log('原始array:', array);
const newArr = quickSort(array);
console.log('newArr:', newArr);
// 原始 array:  [5, 4, 3, 2, 1]
// newArr:     [1, 4, 3, 2, 5]

分析

  • 第一,快速排序是原地排序算法嗎 ?

由於 partition() 函數進行分區時,不須要不少額外的內存空間,因此快排是原地排序算法。

  • 第二,快速排序是穩定的排序算法嗎 ?

和選擇排序類似,快速排序每次交換的元素都有可能不是相鄰的,所以它有可能打破原來值爲相同的元素之間的順序。所以,快速排序並不穩定

  • 第三,快速排序的時間複雜度是多少 ?

極端的例子:若是數組中的數據原來已是有序的了,好比 1,3,5,6,8。若是咱們每次選擇最後一個元素做爲 pivot,那每次分區獲得的兩個區間都是不均等的。咱們須要進行大約 n 次分區操做,才能完成快排的整個過程。每次分區咱們平均要掃描大約 n / 2 個元素,這種狀況下,快排的時間複雜度就從 O(nlogn) 退化成了 O(n2)。
最佳狀況:T(n) = O(n log n)。
最差狀況:T(n) = O(n2)。
平均狀況:T(n) = O(n log n)。

動畫

strip

解答開篇問題

快排和歸併用的都是分治思想,遞推公式和遞歸代碼也很是類似,那它們的區別在哪裏呢 ?

clipboard.png

能夠發現:

  • 歸併排序的處理過程是由下而上的,先處理子問題,而後再合併。
  • 而快排正好相反,它的處理過程是由上而下的,先分區,而後再處理子問題。
  • 歸併排序雖然是穩定的、時間複雜度爲 O(nlogn) 的排序算法,可是它是非原地排序算法。
  • 歸併之因此是非原地排序算法,主要緣由是合併函數沒法在原地執行。
  • 快速排序經過設計巧妙的原地分區函數,能夠實現原地排序,解決了歸併排序佔用太多內存的問題。

3.6 希爾排序(Shell Sort)

思想

  • 先將整個待排序的記錄序列分割成爲若干子序列。
  • 分別進行直接插入排序。
  • 待整個序列中的記錄基本有序時,再對全體記錄進行依次直接插入排序。

過程

1.舉個易於理解的例子:[35, 33, 42, 10, 14, 19, 27, 44],咱們採起間隔 4。建立一個位於 4 個位置間隔的全部值的虛擬子列表。下面這些值是 { 35, 14 },{ 33, 19 },{ 42, 27 } 和 { 10, 44 }。

clipboard.png

2.咱們比較每一個子列表中的值,並在原始數組中交換它們(若是須要)。完成此步驟後,新數組應以下所示。

clipboard.png

3.而後,咱們採用 2 的間隔,這個間隙產生兩個子列表:{ 14, 27, 35, 42 }, { 19, 10, 33, 44 }。

clipboard.png

4.咱們比較並交換原始數組中的值(若是須要)。完成此步驟後,數組變成:[14, 10, 27, 19, 35, 33, 42, 44],圖以下所示,10 與 19 的位置互換一下。

clipboard.png

5.最後,咱們使用值間隔 1 對數組的其他部分進行排序,Shell sort 使用插入排序對數組進行排序。

clipboard.png

實現

const shellSort = arr => {
    let len = arr.length,
        temp,
        gap = 1;
    console.time('希爾排序耗時');
    while (gap < len / 3) {
        //動態定義間隔序列
        gap = gap * 3 + 1;
    }
    for (gap; gap > 0; gap = Math.floor(gap / 3)) {
        for (let i = gap; i < len; i++) {
            temp = arr[i];
            let j = i - gap;
            for (; j >= 0 && arr[j] > temp; j -= gap) {
                arr[j + gap] = arr[j];
            }
            arr[j + gap] = temp;
            console.log('arr  :', arr);
        }
    }
    console.timeEnd('希爾排序耗時');
    return arr;
};

測試

// 測試
const array = [35, 33, 42, 10, 14, 19, 27, 44];
console.log('原始array:', array);
const newArr = shellSort(array);
console.log('newArr:', newArr);
// 原始 array:   [35, 33, 42, 10, 14, 19, 27, 44]
// arr      :   [14, 33, 42, 10, 35, 19, 27, 44]
// arr      :   [14, 19, 42, 10, 35, 33, 27, 44]
// arr      :   [14, 19, 27, 10, 35, 33, 42, 44]
// arr      :   [14, 19, 27, 10, 35, 33, 42, 44]
// arr      :   [14, 19, 27, 10, 35, 33, 42, 44]
// arr      :   [14, 19, 27, 10, 35, 33, 42, 44]
// arr      :   [10, 14, 19, 27, 35, 33, 42, 44]
// arr      :   [10, 14, 19, 27, 35, 33, 42, 44]
// arr      :   [10, 14, 19, 27, 33, 35, 42, 44]
// arr      :   [10, 14, 19, 27, 33, 35, 42, 44]
// arr      :   [10, 14, 19, 27, 33, 35, 42, 44]
// 希爾排序耗時: 3.592041015625ms
// newArr:     [10, 14, 19, 27, 33, 35, 42, 44]

分析

  • 第一,希爾排序是原地排序算法嗎 ?

希爾排序過程當中,只涉及相鄰數據的交換操做,只須要常量級的臨時空間,空間複雜度爲 O(1) 。因此,希爾排序是原地排序算法。

  • 第二,希爾排序是穩定的排序算法嗎 ?

咱們知道,單次直接插入排序是穩定的,它不會改變相同元素之間的相對順序,但在屢次不一樣的插入排序過程當中,相同的元素可能在各自的插入排序中移動,可能致使相同元素相對順序發生變化。
所以,希爾排序不穩定

  • 第三,希爾排序的時間複雜度是多少 ?

最佳狀況:T(n) = O(n log n)。
最差狀況:T(n) = O(n log2 n)。
平均狀況:T(n) = O(n log2 n)。

動畫

strip

3.7 堆排序(Heap Sort)

堆的定義

堆實際上是一種特殊的樹。只要知足這兩點,它就是一個堆。

  • 堆是一個徹底二叉樹。

徹底二叉樹:除了最後一層,其餘層的節點個數都是滿的,最後一層的節點都靠左排列。

  • 堆中每個節點的值都必須大於等於(或小於等於)其子樹中每一個節點的值。

也能夠說:堆中每一個節點的值都大於等於(或者小於等於)其左右子節點的值。這兩種表述是等價的。

對於每一個節點的值都大於等於子樹中每一個節點值的堆,咱們叫做大頂堆
對於每一個節點的值都小於等於子樹中每一個節點值的堆,咱們叫做小頂堆

clipboard.png

其中圖 1 和 圖 2 是大頂堆,圖 3 是小頂堆,圖 4 不是堆。除此以外,從圖中還能夠看出來,對於同一組數據,咱們能夠構建多種不一樣形態的堆。

思想

  1. 將初始待排序關鍵字序列 (R1, R2 .... Rn) 構建成大頂堆,此堆爲初始的無序區;
  2. 將堆頂元素 R[1] 與最後一個元素 R[n] 交換,此時獲得新的無序區 (R1, R2, ..... Rn-1) 和新的有序區 (Rn) ,且知足 R[1, 2 ... n-1] <= R[n]。
  3. 因爲交換後新的堆頂 R[1] 可能違反堆的性質,所以須要對當前無序區 (R1, R2 ...... Rn-1) 調整爲新堆,而後再次將 R[1] 與無序區最後一個元素交換,獲得新的無序區 (R1, R2 .... Rn-2) 和新的有序區 (Rn-1, Rn)。不斷重複此過程,直到有序區的元素個數爲 n - 1,則整個排序過程完成。

實現

// 堆排序
const heapSort = array => {
    console.time('堆排序耗時');
    // 初始化大頂堆,從第一個非葉子結點開始
    for (let i = Math.floor(array.length / 2 - 1); i >= 0; i--) {
        heapify(array, i, array.length);
    }
    // 排序,每一次 for 循環找出一個當前最大值,數組長度減一
    for (let i = Math.floor(array.length - 1); i > 0; i--) {
        // 根節點與最後一個節點交換
        swap(array, 0, i);
        // 從根節點開始調整,而且最後一個結點已經爲當前最大值,不須要再參與比較,因此第三個參數爲 i,即比較到最後一個結點前一個便可
        heapify(array, 0, i);
    }
    console.timeEnd('堆排序耗時');
    return array;
};

// 交換兩個節點
const swap = (array, i, j) => {
    let temp = array[i];
    array[i] = array[j];
    array[j] = temp;
};

// 將 i 結點如下的堆整理爲大頂堆,注意這一步實現的基礎其實是:
// 假設結點 i 如下的子堆已是一個大頂堆,heapify 函數實現的
// 功能是其實是:找到 結點 i 在包括結點 i 的堆中的正確位置。
// 後面將寫一個 for 循環,從第一個非葉子結點開始,對每個非葉子結點
// 都執行 heapify 操做,因此就知足告終點 i 如下的子堆已是一大頂堆
const heapify = (array, i, length) => {
    let temp = array[i]; // 當前父節點
    // j < length 的目的是對結點 i 如下的結點所有作順序調整
    for (let j = 2 * i + 1; j < length; j = 2 * j + 1) {
        temp = array[i]; // 將 array[i] 取出,整個過程至關於找到 array[i] 應處於的位置
        if (j + 1 < length && array[j] < array[j + 1]) {
            j++; // 找到兩個孩子中較大的一個,再與父節點比較
        }
        if (temp < array[j]) {
            swap(array, i, j); // 若是父節點小於子節點:交換;不然跳出
            i = j; // 交換後,temp 的下標變爲 j
        } else {
            break;
        }
    }
};

測試

const array = [4, 6, 8, 5, 9, 1, 2, 5, 3, 2];
console.log('原始array:', array);
const newArr = heapSort(array);
console.log('newArr:', newArr);
// 原始 array:  [4, 6, 8, 5, 9, 1, 2, 5, 3, 2]
// 堆排序耗時: 0.15087890625ms
// newArr:     [1, 2, 2, 3, 4, 5, 5, 6, 8, 9]

分析

  • 第一,堆排序是原地排序算法嗎 ?

整個堆排序的過程,都只須要極個別臨時存儲空間,因此堆排序原地排序算法。

  • 第二,堆排序是穩定的排序算法嗎 ?

由於在排序的過程,存在將堆的最後一個節點跟堆頂節點互換的操做,因此就有可能改變值相同數據的原始相對順序。
因此,堆排序是不穩定的排序算法。

  • 第三,堆排序的時間複雜度是多少 ?

堆排序包括建堆和排序兩個操做,建堆過程的時間複雜度是 O(n),排序過程的時間複雜度是 O(nlogn),因此,堆排序總體的時間複雜度是 O(nlogn)。
最佳狀況:T(n) = O(n log n)。
最差狀況:T(n) = O(n log n)。
平均狀況:T(n) = O(n log n)。

動畫

strip

strip

3.8 桶排序(Bucket Sort)

桶排序是計數排序的升級版,也採用了分治思想

思想

  • 將要排序的數據分到有限數量的幾個有序的桶裏。
  • 每一個桶裏的數據再單獨進行排序(通常用插入排序或者快速排序)。
  • 桶內排完序以後,再把每一個桶裏的數據按照順序依次取出,組成的序列就是有序的了。

好比:

clipboard.png

桶排序利用了函數的映射關係,高效與否的關鍵就在於這個映射函數的肯定。

爲了使桶排序更加高效,咱們須要作到這兩點:

  • 在額外空間充足的狀況下,儘可能增大桶的數量。
  • 使用的映射函數可以將輸入的 N 個數據均勻的分配到 K 個桶中。

桶排序的核心:就在於怎麼把元素平均分配到每一個桶裏,合理的分配將大大提升排序的效率。

實現

// 桶排序
const bucketSort = (array, bucketSize) => {
  if (array.length === 0) {
    return array;
  }

  console.time('桶排序耗時');
  let i = 0;
  let minValue = array[0];
  let maxValue = array[0];
  for (i = 1; i < array.length; i++) {
    if (array[i] < minValue) {
      minValue = array[i]; //輸入數據的最小值
    } else if (array[i] > maxValue) {
      maxValue = array[i]; //輸入數據的最大值
    }
  }

  //桶的初始化
  const DEFAULT_BUCKET_SIZE = 5; //設置桶的默認數量爲 5
  bucketSize = bucketSize || DEFAULT_BUCKET_SIZE;
  const bucketCount = Math.floor((maxValue - minValue) / bucketSize) + 1;
  const buckets = new Array(bucketCount);
  for (i = 0; i < buckets.length; i++) {
    buckets[i] = [];
  }

  //利用映射函數將數據分配到各個桶中
  for (i = 0; i < array.length; i++) {
    buckets[Math.floor((array[i] - minValue) / bucketSize)].push(array[i]);
  }

  array.length = 0;
  for (i = 0; i < buckets.length; i++) {
    quickSort(buckets[i]); //對每一個桶進行排序,這裏使用了快速排序
    for (var j = 0; j < buckets[i].length; j++) {
      array.push(buckets[i][j]);
    }
  }
  console.timeEnd('桶排序耗時');

  return array;
};

// 快速排序
const quickSort = (arr, left, right) => {
    let len = arr.length,
        partitionIndex;
    left = typeof left != 'number' ? 0 : left;
    right = typeof right != 'number' ? len - 1 : right;

    if (left < right) {
        partitionIndex = partition(arr, left, right);
        quickSort(arr, left, partitionIndex - 1);
        quickSort(arr, partitionIndex + 1, right);
    }
    return arr;
};

const partition = (arr, left, right) => {
    //分區操做
    let pivot = left, //設定基準值(pivot)
        index = pivot + 1;
    for (let i = index; i <= right; i++) {
        if (arr[i] < arr[pivot]) {
            swap(arr, i, index);
            index++;
        }
    }
    swap(arr, pivot, index - 1);
    return index - 1;
};

const swap = (arr, i, j) => {
    let temp = arr[i];
    arr[i] = arr[j];
    arr[j] = temp;
};

測試

const array = [4, 6, 8, 5, 9, 1, 2, 5, 3, 2];
console.log('原始array:', array);
const newArr = bucketSort(array);
console.log('newArr:', newArr);
// 原始 array:  [4, 6, 8, 5, 9, 1, 2, 5, 3, 2]
// 堆排序耗時:   0.133056640625ms
// newArr:       [1, 2, 2, 3, 4, 5, 5, 6, 8, 9]

分析

  • 第一,桶排序是原地排序算法嗎 ?

由於桶排序的空間複雜度,也即內存消耗爲 O(n),因此不是原地排序算法。

  • 第二,桶排序是穩定的排序算法嗎 ?

取決於每一個桶的排序方式,好比:快排就不穩定,歸併就穩定。

  • 第三,桶排序的時間複雜度是多少 ?

由於桶內部的排序能夠有多種方法,是會對桶排序的時間複雜度產生很重大的影響。因此,桶排序的時間複雜度能夠是多種狀況的。
總的來講
最佳狀況:當輸入的數據能夠均勻的分配到每個桶中。
最差狀況:當輸入的數據被分配到了同一個桶中。
如下是桶的內部排序快速排序的狀況:
若是要排序的數據有 n 個,咱們把它們均勻地劃分到 m 個桶內,每一個桶裏就有 k =n / m 個元素。每一個桶內部使用快速排序,時間複雜度爲 O(k * logk)。
m 個桶排序的時間複雜度就是 O(m k logk),由於 k = n / m,因此整個桶排序的時間複雜度就是 O(n*log(n/m))。
當桶的個數 m 接近數據個數 n 時,log(n/m) 就是一個很是小的常量,這個時候桶排序的時間複雜度接近 O(n)。
最佳狀況:T(n) = O(n)。當輸入的數據能夠均勻的分配到每個桶中。
最差狀況:T(n) = O(nlogn)。當輸入的數據被分配到了同一個桶中。
平均狀況:T(n) = O(n)。

桶排序最好狀況下使用線性時間 O(n),桶排序的時間複雜度,取決與對各個桶之間數據進行排序的時間複雜度,由於其它部分的時間複雜度都爲 O(n)。
很顯然,桶劃分的越小,各個桶之間的數據越少,排序所用的時間也會越少。但相應的空間消耗就會增大。

適用場景

  • 桶排序比較適合用在外部排序中。
  • 外部排序就是數據存儲在外部磁盤且數據量大,但內存有限,沒法將整個數據所有加載到內存中。

動畫

strip

3.9 計數排序(Counting Sort)

思想

  • 找出待排序的數組中最大和最小的元素。
  • 統計數組中每一個值爲 i 的元素出現的次數,存入新數組 countArr 的第 i 項。
  • 對全部的計數累加(從 countArr 中的第一個元素開始,每一項和前一項相加)。
  • 反向填充目標數組:將每一個元素 i 放在新數組的第 countArr[i] 項,每放一個元素就將 countArr[i] 減去 1 。

關鍵在於理解最後反向填充時的操做。

使用條件

  • 只能用在數據範圍不大的場景中,若數據範圍 k 比要排序的數據 n 大不少,就不適合用計數排序。
  • 計數排序只能給非負整數排序,其餘類型須要在不改變相對大小狀況下,轉換爲非負整數。
  • 好比若是考試成績精確到小數後一位,就須要將全部分數乘以 10,轉換爲整數。

實現

方法一:

const countingSort = array => {
    let len = array.length,
        result = [],
        countArr = [],
        min = (max = array[0]);
    console.time('計數排序耗時');
    for (let i = 0; i < len; i++) {
        // 獲取最小,最大 值
        min = min <= array[i] ? min : array[i];
        max = max >= array[i] ? max : array[i];
        countArr[array[i]] = countArr[array[i]] ? countArr[array[i]] + 1 : 1;
    }
    console.log('countArr :', countArr);
    // 從最小值 -> 最大值,將計數逐項相加
    for (let j = min; j < max; j++) {
        countArr[j + 1] = (countArr[j + 1] || 0) + (countArr[j] || 0);
    }
    console.log('countArr 2:', countArr);
    // countArr 中,下標爲 array 數值,數據爲 array 數值出現次數;反向填充數據進入 result 數據
    for (let k = len - 1; k >= 0; k--) {
        // result[位置] = array 數據
        result[countArr[array[k]] - 1] = array[k];
        // 減小 countArr 數組中保存的計數
        countArr[array[k]]--;
        // console.log("array[k]:", array[k], 'countArr[array[k]] :', countArr[array[k]],)
        console.log('result:', result);
    }
    console.timeEnd('計數排序耗時');
    return result;
};

測試

const array = [2, 2, 3, 8, 7, 1, 2, 2, 2, 7, 3, 9, 8, 2, 1, 4, 2, 4, 6, 9, 2];
console.log('原始 array: ', array);
const newArr = countingSort(array);
console.log('newArr: ', newArr);
// 原始 array:  [2, 2, 3, 8, 7, 1, 2, 2, 2, 7, 3, 9, 8, 2, 1, 4, 2, 4, 6, 9, 2]
// 計數排序耗時:   5.6708984375ms
// newArr:       [1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 4, 4, 6, 7, 7, 8, 8, 9, 9]

clipboard.png

方法二:

const countingSort2 = (arr, maxValue) => {
    console.time('計數排序耗時');
    maxValue = maxValue || arr.length;
    let bucket = new Array(maxValue + 1),
        sortedIndex = 0;
    (arrLen = arr.length), (bucketLen = maxValue + 1);

    for (let i = 0; i < arrLen; i++) {
        if (!bucket[arr[i]]) {
            bucket[arr[i]] = 0;
        }
        bucket[arr[i]]++;
    }

    for (let j = 0; j < bucketLen; j++) {
        while (bucket[j] > 0) {
            arr[sortedIndex++] = j;
            bucket[j]--;
        }
    }
    console.timeEnd('計數排序耗時');
    return arr;
};

測試

const array2 = [2, 2, 3, 8, 7, 1, 2, 2, 2, 7, 3, 9, 8, 2, 1, 4, 2, 4, 6, 9, 2];
console.log('原始 array2: ', array2);
const newArr2 = countingSort2(array2, 21);
console.log('newArr2: ', newArr2);
// 原始 array:  [2, 2, 3, 8, 7, 1, 2, 2, 2, 7, 3, 9, 8, 2, 1, 4, 2, 4, 6, 9, 2]
// 計數排序耗時:   0.043212890625ms
// newArr:       [1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 4, 4, 6, 7, 7, 8, 8, 9, 9]

例子

能夠認爲,計數排序實際上是桶排序的一種特殊狀況

當要排序的 n 個數據,所處的範圍並不大的時候,好比最大值是 k,咱們就能夠把數據劃分紅 k 個桶。每一個桶內的數據值都是相同的,省掉了桶內排序的時間。

咱們都經歷太高考,高考查分數系統你還記得嗎?咱們查分數的時候,系統會顯示咱們的成績以及所在省的排名。若是你所在的省有 50 萬考生,如何經過成績快速排序得出名次呢?

  • 考生的滿分是 900 分,最小是 0 分,這個數據的範圍很小,因此咱們能夠分紅 901 個桶,對應分數從 0 分到 900 分。
  • 根據考生的成績,咱們將這 50 萬考生劃分到這 901 個桶裏。桶內的數據都是分數相同的考生,因此並不須要再進行排序。
  • 咱們只須要依次掃描每一個桶,將桶內的考生依次輸出到一個數組中,就實現了 50 萬考生的排序。
  • 由於只涉及掃描遍歷操做,因此時間複雜度是 O(n)。

分析

  • 第一,計數排序是原地排序算法嗎 ?

由於計數排序的空間複雜度爲 O(k),k 桶的個數,因此不是原地排序算法。

  • 第二,計數排序是穩定的排序算法嗎 ?

計數排序不改變相同元素之間本來相對的順序,所以它是穩定的排序算法。

  • 第三,計數排序的時間複雜度是多少 ?

最佳狀況:T(n) = O(n + k)
最差狀況:T(n) = O(n + k)
平均狀況:T(n) = O(n + k)
k 是待排序列最大值。

動畫

strip

3.10 基數排序(Radix Sort)

思想

基數排序是一種非比較型整數排序算法,其原理是將整數按位數切割成不一樣的數字,而後按每一個位數分別比較。

例子

假設咱們有 10 萬個手機號碼,但願將這 10 萬個手機號碼從小到大排序,你有什麼比較快速的排序方法呢 ?

這個問題裏有這樣的規律:假設要比較兩個手機號碼 a,b 的大小,若是在前面幾位中,a 手機號碼已經比 b 手機號碼大了,那後面的幾位就不用看了。因此是基於來比較的。

桶排序、計數排序能派上用場嗎 ?手機號碼有 11 位,範圍太大,顯然不適合用這兩種排序算法。針對這個排序問題,有沒有時間複雜度是 O(n) 的算法呢 ? 有,就是基數排序。

使用條件

  • 要求數據能夠分割獨立的來比較;
  • 位之間由遞進關係,若是 a 數據的高位比 b 數據大,那麼剩下的地位就不用比較了;
  • 每一位的數據範圍不能太大,要能夠用線性排序,不然基數排序的時間複雜度沒法作到 O(n)。

方案

按照優先從高位或低位來排序有兩種實現方案:

  • MSD:由高位爲基底,先按 k1 排序分組,同一組中記錄, 關鍵碼 k1 相等,再對各組按 k2 排序分紅子組, 以後,對後面的關鍵碼繼續這樣的排序分組,直到按最次位關鍵碼 kd 對各子組排序後,再將各組鏈接起來,便獲得一個有序序列。MSD 方式適用於位數多的序列。
  • LSD:由低位爲基底,先從 kd 開始排序,再對 kd - 1 進行排序,依次重複,直到對 k1 排序後便獲得一個有序序列。LSD 方式適用於位數少的序列。

實現

/**
    * name: 基數排序
    * @param  array 待排序數組
    * @param  max 最大位數
    */
const radixSort = (array, max) => {
    console.time('計數排序耗時');
    const buckets = [];
    let unit = 10,
        base = 1;
    for (let i = 0; i < max; i++, base *= 10, unit *= 10) {
        for (let j = 0; j < array.length; j++) {
            let index = ~~((array[j] % unit) / base); //依次過濾出個位,十位等等數字
            if (buckets[index] == null) {
                buckets[index] = []; //初始化桶
            }
            buckets[index].push(array[j]); //往不一樣桶裏添加數據
        }
        let pos = 0,
            value;
        for (let j = 0, length = buckets.length; j < length; j++) {
            if (buckets[j] != null) {
                while ((value = buckets[j].shift()) != null) {
                    array[pos++] = value; //將不一樣桶裏數據挨個撈出來,爲下一輪高位排序作準備,因爲靠近桶底的元素排名靠前,所以從桶底先撈
                }
            }
        }
    }
    console.timeEnd('計數排序耗時');
    return array;
};

測試

const array = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48];
console.log('原始array:', array);
const newArr = radixSort(array, 2);
console.log('newArr:', newArr);
// 原始 array:  [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
// 堆排序耗時:   0.064208984375ms
// newArr:       [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]

分析

  • 第一,基數排序是原地排序算法嗎 ?

由於計數排序的空間複雜度爲 O(n + k),因此不是原地排序算法。

  • 第二,基數排序是穩定的排序算法嗎 ?

基數排序不改變相同元素之間的相對順序,所以它是穩定的排序算法。

  • 第三,基數排序的時間複雜度是多少 ?

最佳狀況:T(n) = O(n * k)
最差狀況:T(n) = O(n * k)
平均狀況:T(n) = O(n * k)
其中,k 是待排序列最大值。

動畫

LSD 基數排序動圖演示:

strip

4. 複雜度對比

十大經典排序算法的 時間複雜度與空間複雜度 比較。

名稱 平均 最好 最壞 空間 穩定性 排序方式
冒泡排序 O(n2) O(n) O(n2) O(1) Yes In-place
插入排序 O(n2) O(n) O(n2) O(1) Yes In-place
選擇排序 O(n2) O(n2) O(n2) O(1) No In-place
歸併排序 O(n log n) O(n log n) O(n log n) O(n) Yes Out-place
快速排序 O(n log n) O(n log n) O(n2) O(logn) No In-place
希爾排序 O(n log n) O(n log2 n) O(n log2 n) O(1) No In-place
堆排序 O(n log n) O(n log n) O(n log n) O(1) No In-place
桶排序 O(n + k) O(n + k) O(n2) O(n + k) Yes Out-place
計數排序 O(n + k) O(n + k) O(n + k) O(k) Yes Out-place
基數排序 O(n * k) O(n * k) O(n * k) O(n + k) Yes Out-place

名詞解釋:

  • n:數據規模;
  • k:桶的個數;
  • In-place: 佔用常數內存,不佔用額外內存;
  • Out-place: 佔用額外內存。

5. 算法可視化工具

  • 算法可視化工具 algorithm-visualizer
    算法可視化工具 algorithm-visualizer 是一個交互式的在線平臺,能夠從代碼中可視化算法,還能夠看到代碼執行的過程。旨在經過交互式可視化的執行來揭示算法背後的機制。

效果以下圖:

strip

效果以下圖:

strip

效果以下圖:

strip

變量和操做的可視化表示加強了控制流和實際源代碼。您能夠快速前進和後退執行,以密切觀察算法的工做方式。
效果以下圖:

strip

6. 系列文章

JavaScript 數據結構與算法之美 系列文章,暫時寫了以下的 11 篇文章,後續還有想寫的內容,再補充。

所寫的內容只是數據結構與算法內容的冰山一角,若是你還想學更多的內容,推薦學習王爭老師的 數據結構與算法之美

從時間和空間複雜度、基礎數據結構到排序算法,文章的內容有必定的關聯性,因此閱讀時推薦按順序來閱讀,效果更佳。

若是有錯誤或者不嚴謹的地方,請務必給予指正,以避免誤人子弟,十分感謝。

7. 最後

文中全部的代碼及測試事例都已經放到個人 GitHub 上了。

筆者爲了寫好這系列的文章,花費了大量的業餘時間,邊學邊寫,邊寫邊修改,先後歷時差很少 2 個月,入門級的文章總算是寫完了。

若是你以爲有用或者喜歡,就點收藏,順便點個贊吧,你的支持是我最大的鼓勵 !

全棧修煉

相關文章
相關標籤/搜索