最近幾天在系統的複習排序算法,以前都沒有系統性的學習過,也沒有留下過什麼筆記,因此很快就忘了,此次好好地學習一下。javascript
首先說明爲了減小限制,如下代碼統統運行於Node V8引擎而非瀏覽器,源碼在個人GitHub,感興趣的話能夠下載來而後運行試試。html
爲了方便對比各個排序算法的性能,這裏先寫了一個生成大規模數組的方法——generateArray
:java
exports.generateArray = function(length) {
let arr = Array(length);
for(let i=0; i<length; i++) {
arr[i] = Math.random();
}
return arr;
};
複製代碼
只須要輸入數組長度,便可生成一個符合長度要求的隨機數組。git
冒泡排序也成爲沉澱排序(sinking sort),冒泡排序得名於其排序方式,它遍歷整個數組,將數組的每一項與其後一項進行對比,若是不符合要求就交換位置,一共遍歷n輪,n爲數組的長度。n輪以後,數組得以徹底排序。整個過程符合要求的數組項就像氣泡從水底冒到水面同樣泡到數組末端,因此叫作冒泡排序。github
冒泡排序是最簡單的排序方法,容易理解、實現簡單,可是冒泡排序是效率最低的排序算法,因爲算法嵌套了兩輪循環(將數組遍歷了n遍),因此時間複雜度爲O(n^2)。最好的狀況下,給出一個已經排序的數組進行冒泡排序,時間複雜度也爲O(n)。算法
特意感謝一下評論中@雪之祈舞的優化,每次冒泡都忽略尾部已經排序好的i項。api
JavaScript實現(從小到大排序):數組
function bubbleSort(arr) {
//console.time('BubbleSort');
// 獲取數組長度,以肯定循環次數。
let len = arr.length;
// 遍歷數組len次,以確保數組被徹底排序。
for(let i=0; i<len; i++) {
// 遍歷數組的前len-i項,忽略後面的i項(已排序部分)。
for(let j=0; j<len - 1 - i; j++) {
// 將每一項與後一項進行對比,不符合要求的就換位。
if(arr[j] > arr[j+1]) {
[arr[j+1], arr[j]] = [arr[j], arr[j+1]];
}
}
}
//console.timeEnd('BubbleSort');
return arr;
}
複製代碼
代碼中的註釋部分的代碼都用於輸出排序時間,供測試使用,下文亦如是。瀏覽器
選擇排序是一種原址比較排序法,大體思路:數據結構
找到數組中的最小(大)值,並將其放到第一位,而後找到第二小的值放到第二位……以此類推。
JavaScript實現(從小到大排序):
function selectionSort(arr) {
//console.time('SelectionSort');
// 獲取數組長度,確保每一項都被排序。
let len = arr.length;
// 遍歷數組的每一項。
for(let i=0; i<len; i++) {
// 從數組的當前項開始,由於左邊部分的數組項已經被排序。
let min = i;
for(let j=i; j<len; j++) {
if(arr[j] < arr[min]) {
min = j;
}
}
if(min !== i) {
[arr[min], arr[i]] = [arr[i], arr[min]];
}
}
//console.timeEnd('SelectionSort');
return arr;
}
複製代碼
因爲嵌套了兩層循環,其時間複雜度也是O(n^2),
插入排序是最接近生活的排序,由於咱們打牌時就差很少是採用的這種排序方法。該方法從數組的第二項開始遍歷數組的n-1
項(n爲數組長度),遍歷過程當中對於當前項的左邊數組項,依次從右到左進行對比,若是左邊選項大於(或小於)當前項,則左邊選項向右移動,而後繼續對比前一項,直到找到不大於(不小於)自身的選項爲止,對於全部大於當前項的選項,都在原來位置的基礎上向右移動了一項。
示例:
// 對於以下數組
var arr = [2,1,3,5,4,3];
// 從第二項(即arr[1])開始遍歷,
// 第一輪:
// a[0] >= 1爲true,a[0]右移,
arr = [2,2,3,5,4,3];
// 而後1賦給a[0],
arr = [1,2,3,5,4,3];
// 而後第二輪:
// a[1] >= 3不成立,該輪遍歷結束。
// 第三輪;
// a[2] >= 5不成立,該輪遍歷結束。
// 第四輪:
// a[3] >= 4爲true,a[3]右移,
arr = [1,2,3,5,5,3];
// a[2] >= 4不成立,將4賦給a[3],而後結束該輪遍歷。
arr = [1,2,3,4,5,3];
// a[4] >= 3成立,a[4]右移一位,
arr = [1,2,3,4,5,5];
// arr[3] >= 3成立,arr[3]右移一位,
arr = [1,2,3,4,4,5];
// arr[2] >= 3成立,arr[2]右移一位,
arr = [1,2,3,3,4,5];
// arr[1] >= 3不成立,將3賦給a[2],結束該輪。
arr = [1,2,3,3,4,5];
// 遍歷完成,排序結束。
複製代碼
若是去掉比較時的等號的話,能夠減小一些步驟,因此在JavaScript代碼中減小了這部分, JavaScript實現(從小到大排序):
function insertionSort(arr) {
//console.time('InsertionSort');
let len = arr.length;
for(let i=1; i<len; i++) {
let j = i;
let tmp = arr[i];
while(j > 0 && arr[j-1] > tmp) {
arr[j] = arr[j-1];
j--;
}
arr[j] = tmp;
}
//console.timeEnd('InsertionSort');
return arr;
}
複製代碼
插入排序比通常的高級排序算法(快排、堆排)性能要差,可是仍是具備如下優勢的:
到目前爲止,已經介紹了三種排序方法,包括冒泡排序、選擇排序和插入排序。這三種排序方法的時間複雜度都爲O(n^2),其中冒泡排序實現最簡單,性能最差,選擇排序比冒泡排序稍好,可是還不夠,插入排序是這三者中表現最好的,對於小數據集而言效率較高。這些緣由致使三者的實用性並不高,都是最基本的簡單排序方法,多用於教學,很難用於實際中,從這節開始介紹更加高級的排序算法。
歸併排序是第一個能夠用於實際的排序算法,前面的三個性能都不夠好,歸併排序的時間複雜度爲O(nlogn),這一點已經因爲前面的三個算法了。
值得注意的是,JavaScript中的Array.prototype.sort
方法沒有規定使用哪一種排序算法,容許瀏覽器自定義,FireFox使用的是歸併排序法,而Chrome使用的是快速排序法。
歸併排序的核心思想是分治,分治是經過遞歸地將問題分解成相同或者類型相關的兩個或者多個子問題,直到問題簡單到足以解決,而後將子問題的解決方案結合起來,解決原始方案的一種思想。
歸併排序經過將複雜的數組分解成足夠小的數組(只包含一個元素),而後經過合併兩個有序數組(單元素數組可認爲是有序數組)來達到綜合子問題解決方案的目的。因此歸併排序的核心在於如何整合兩個有序數組,拆分數組只是一個輔助過程。
示例:
// 假設有如下數組,對其進行歸併排序使其按從小到大的順序排列:
var arr = [8,7,6,5];
// 對其進行分解,獲得兩個數組:
[8,7]和[6,5]
// 而後繼續進行分解,分別再獲得兩個數組,直到數組只包含一個元素:
[8]、[7]、[6]、[5]
// 開始合併數組,獲得如下兩個數組:
[7,8]和[5,6]
// 繼續合併,獲得
[5,6,7,8]
// 排序完成
複製代碼
JavaScript實現(從小到大排序):
function mergeSort(arr) {
//console.time('MergeSort');
//let count = 0;
console.log(main(arr));
//console.timeEnd('MergeSort');
//return count;
// 主函數。
function main(arr) {
// 記得添加判斷,防止無窮遞歸致使callstack溢出,此外也是將數組進行分解的終止條件。
if(arr.length === 1) return arr;
// 從中間開始分解,並構造左邊數組和右邊數組。
let mid = Math.floor(arr.length/2);
let left = arr.slice(0, mid);
let right = arr.slice(mid);
// 開始遞歸調用。
return merge(arguments.callee(left), arguments.callee(right));
}
// 數組的合併函數,left是左邊的有序數組,right是右邊的有序數組。
function merge(left, right) {
// il是左邊數組的一個指針,rl是右邊數組的一個指針。
let il = 0,
rl = 0,
result = [];
// 同時遍歷左右兩個數組,直到有一個指針超出範圍。
while(il < left.length && rl < right.length) {
//count++;
// 左邊數組的當前項若是小於右邊數組的當前項,那麼將左邊數組的當前項推入result,反之亦然,同時將推入過的指針右移。
if(left[il] < right[rl]) {
result.push(left[il++]);
}
else {
result.push(right[rl++]);
}
}
// 記得要將未讀完的數組的多餘部分讀到result。
return result.concat(left.slice(il)).concat(right.slice(rl));
}
}
複製代碼
注意是由於數組被分解成爲了只有一個元素的許多子數組,因此merge函數從單個元素的數組開始合併,當合並的數組的元素個數超過1時,即爲有序數組,仍然還能夠繼續使用merge函數進行合併。
歸併排序的性能確實達到了應用級別,可是仍是有些不足,由於這裏的merge函數新建了一個result數組來盛放合併後的數組,致使空間複雜度增長,這裏還能夠進行優化,使得數組進行原地排序。
快速排序由Tony Hoare在1959年發明,是當前最爲經常使用的排序方案,若是使用得當,其速度比通常算法能夠快兩到三倍,比之冒泡排序、選擇排序等能夠說快成千上萬倍。快速排序的複雜度爲O(nlogn),其核心思想也是分而治之,它遞歸地將大數組分解爲小數組,直到數組長度爲1,不過與歸併排序的區別在於其重點在於數組的分解,而歸併排序的重點在於數組的合併。
基本思想:
在數組中選取一個參考點(pivot),而後對於數組中的每一項,大於pivot的項都放到數組右邊,小於pivot的項都放到左邊,左右兩邊的數組項能夠構成兩個新的數組(left和right),而後繼續分別對left和right進行分解,直到數組長度爲1,最後合併(其實沒有合併,由於是在原數組的基礎上操做的,只是理論上的進行了數組分解)。
基本步驟:
JavaScript實現(從小到大排序):
function quickSort(arr) {
let left = 0,
right = arr.length - 1;
//console.time('QuickSort');
main(arr, left, right);
//console.timeEnd('QuickSort');
return arr;
function main(arr, left, right) {
// 遞歸結束的條件,直到數組只包含一個元素。
if(arr.length === 1) {
// 因爲是直接修改arr,因此不用返回值。
return;
}
// 獲取left指針,準備下一輪分解。
let index = partition(arr, left, right);
if(left < index - 1) {
// 繼續分解左邊數組。
main(arr, left, index - 1);
}
if(index < right) {
// 分解右邊數組。
main(arr, index, right);
}
}
// 數組分解函數。
function partition(arr, left, right) {
// 選取中間項爲參考點。
let pivot = arr[Math.floor((left + right) / 2)];
// 循環直到left > right。
while(left <= right) {
// 持續右移左指針直到其值不小於pivot。
while(arr[left] < pivot) {
left++;
}
// 持續左移右指針直到其值不大於pivot。
while(arr[right] > pivot) {
right--;
}
// 此時左指針的值不小於pivot,右指針的值不大於pivot。
// 若是left仍然不大於right。
if(left <= right) {
// 交換二者的值,使得不大於pivot的值在其左側,不小於pivot的值在其右側。
[arr[left], arr[right]] = [arr[right], arr[left]];
// 左指針右移,右指針左移準備開始下一輪,防止arr[left]和arr[right]都等於pivot而後致使死循環。
left++;
right--;
}
}
// 返回左指針做爲下一輪分解的依據。
return left;
}
}
複製代碼
快速排序相對於歸併排序而言增強了分解部分的邏輯,消除了數組的合併工做,而且不用分配新的內存來存放數組合並結果,因此性能更加優秀,是目前最經常使用的排序方案。
以前還在知乎上看到過一個回答,代碼大體以下(從小到大排序):
function quickSort(arr) {
// 當數組長度不大於1時,返回結果,防止callstack溢出。
if(arr.length <= 1) return arr;
return [
// 遞歸調用quickSort,經過Array.prototype.filter方法過濾小於arr[0]的值,注意去掉了arr[0]以防止出現死循環。
...quickSort(arr.slice(1).filter(item => item < arr[0])),
arr[0],
...quickSort(arr.slice(1).filter(item => item >= arr[0]))
];
}
複製代碼
以上代碼有利於對快排思想的理解,可是實際運用效果不太好,不如以前的代碼速度快。
若是說快速排序是應用性最強的排序算法,那麼我以爲堆排序是趣味性最強的排序方法,很是有意思。
堆排序也是一種很高效的排序方法,由於它把數組做爲二叉樹排序而得名,能夠認爲是歸併排序的改良方案,它是一種原地排序方法,可是不夠穩定,其時間複雜度爲O(nlogn)。
實現步驟:
數組構建的堆結構:
// 數組
var arr = [1,2,3,4,5,6,7];
// 堆結構
1
/ \
2 3
/ \ / \
4 5 6 7
複製代碼
能夠發現對於數組下標爲i
的數組項,其左子節點的值爲下標2*i + 1
對應的數組項,右子節點的值爲下標2*i + 2
對應的數組項。
實際上並無在內存中開闢一塊空間構建堆結構來存儲數組數據,只是在邏輯上把數組當作二叉樹來對待,構建堆結構指的是使其任意父節點的子節點都不大於(不小於)父節點。
JavaScript實現(從小到大排序):
function heapSort(arr) {
//console.time('HeapSort');
buildHeap(arr);
for(let i=arr.length-1; i>0; i--) {
// 從最右側的葉子節點開始,依次與根節點的值交換。
[arr[i], arr[0]] = [arr[0], arr[i]];
// 每次交換以後都要從新構建堆結構,記得傳入i限制範圍,防止已經交換的值仍然被從新構建。
heapify(arr, i, 0);
}
//console.timeEnd('HeapSort');
return arr;
function buildHeap(arr) {
// 能夠觀察到中間下標對應最右邊葉子節點的父節點。
let mid = Math.floor(arr.length / 2);
for(let i=mid; i>=0; i--) {
// 將整個數組構建成堆結構以便初始化。
heapify(arr, arr.length, i);
}
return arr;
}
// 從i節點開始下標在heapSize內進行堆結構構建的函數。
function heapify(arr, heapSize, i) {
// 左子節點下標。
let left = 2 * i + 1,
// 右子節點下標。
right = 2 * i + 2,
// 假設當前父節點知足要求(比子節點都大)。
largest = i;
// 若是左子節點在heapSize內,而且值大於其父節點,那麼left賦給largest。
if(left < heapSize && arr[left] > arr[largest]) {
largest = left;
}
// 若是右子節點在heapSize內,而且值大於其父節點,那麼right賦給largest。
if(right < heapSize && arr[right] > arr[largest]) {
largest = right;
}
if(largest !== i) {
// 若是largest被修改了,那麼交換二者的值使得構形成一個合格的堆結構。
[arr[largest], arr[i]] = [arr[i], arr[largest]];
// 遞歸調用自身,將節點i全部的子節點都構建成堆結構。
arguments.callee(arr, heapSize, largest);
}
return arr;
}
}
複製代碼
堆排序的性能稍遜於快速排序,可是真的頗有意思。
經過console.time()
和console.timeEnd()
查看排序所用時間,經過generateArray()
產生大規模的數據,最終獲得以下結論:
經過對冒泡排序的測試,獲得如下數據:
BubbleSort: 406.567ms
複製代碼
給10000(一萬)條數據進行排序,耗時406毫秒。
BubbleSort: 1665.196ms
複製代碼
給20000(兩萬)條數據進行排序,耗時1.6s。
BubbleSort: 18946.897ms
複製代碼
給50000(五萬)條數據進行排序,耗時19s。 因爲機器不太好,當數據量達到100000時基本就很是漫長了,具體多久也沒等過,這已經能夠看出來性能很是很差了。
經過對選擇排序的測試,獲得如下數據:
SelectionSort: 1917.083ms
複製代碼
對20000(兩萬)條數據進行排序,耗時1.9s。
SelectionSort: 12233.060ms
複製代碼
給50000(五萬)條數據進行排序時,耗時12.2s,能夠看出相對於冒泡排序而言已經有了進步,可是遠遠不夠。還能夠看出隨着數據量的增加,排序的時間消耗愈來愈大。
經過對插入排序的測試,獲得如下數據:
InsertionSort: 273.891ms
複製代碼
對20000(兩萬)條數據進行排序,耗時0.27s。
InsertionSort: 1500.631ms
複製代碼
對50000(五萬)條數據進行排序,耗時1.5s。
InsertionSort: 7467.029ms
複製代碼
對100000(十萬)條數據進行排序,耗時7.5秒,對比選擇排序,又有了很大的改善,可是仍然不夠。
經過對歸併排序的測試,獲得如下數據:
MergeSort: 287.361ms
複製代碼
對100000(十萬)條數據進行排序,耗時0.3秒,真的很優秀了hhh,
MergeSort: 2354.007ms
複製代碼
對1000000(一百萬)條數據進行排序,耗時2.4s,絕對的優秀,難怪FireFox會使用這個來定義Array.prototype.sort
方法,
MergeSort: 26220.459ms
複製代碼
對10000000(一千萬)條數據進行排序,耗時26s,還不錯。 接下來看快排。
經過對快速排序的測試,獲得如下數據:
QuickSort: 51.446ms
複製代碼
100000(十萬)條數據排序耗時0.05s,達到了能夠忽略的境界,
QuickSort: 463.528ms
複製代碼
1000000(一百萬)條數據排序耗時0.46s,也基本能夠忽略,太優秀了,
QuickSort: 5181.508ms
複製代碼
10000000(一千萬)條數據排序耗時5.2s,徹底能夠接受。
經過對堆排序的測試,獲得如下數據:
HeapSort: 3124.188ms
複製代碼
對1000000(一百萬)條數據進行排序,耗時3.1s,遜色於快速排序和歸併排序,可是對比其餘的排序方法仍是不錯的啦。
HeapSort: 41746.788ms
複製代碼
對10000000(一千萬)條數據進行排序,耗時41.7s,不太能接受。
之前都認爲排序方法隨便用用無可厚非,如今想一想確實挺naive的hhh,想到了之前實習的時候,SQL Server幾百萬數據幾秒鐘就排序完成了,這要是用冒泡排序還不得等到兩眼發黑?經過此次學習總結排序算法,尤爲是對於每種方法性能的測試,我深入地認識到了算法設計的重要性,只有重視算法的設計、複雜度的對比,才能寫出優秀的算法,基於優秀的算法才能寫出性能出色的應用!
此外,因爲對於算法複雜度的研究不夠深刻,理解只停留在表面,因此文中若是存在有錯誤,懇請大牛不吝賜教!
最後,我想說一聲,支持阮老師!