’快速排序‘ （quicksort）算法的探討（1）--- 處理大量重複數據

時間 2019-11-15

標籤快速排序 quicksort 算法探討處理大量重複數據简体版

原文原文鏈接

quicksort在序列的各個元素不相同時效率比較高, nlgn。dom

可是，若是序列的各個元素幾乎都相同時，效率就低了，n^2。ide

如下是我對randomized quicksort的一個測試測試

./quicksort [size] [range] 表示 sort [size] elements of range [0 - range]ui

~/MyPro/Algorithms/sort $ ./quicksort 1024 10000000
start sorting ...
sorting finished!
====================================
Randomized Quicksort
Sorting 1024 elements
Time: 0s 468us
The result is right !
====================================code

~/MyPro/Algorithms/sort $ ./quicksort 1024 1
start sorting ...
sorting finished!
====================================
Randomized Quicksort
Sorting 1024 elements
Time: 0s 15426us
The result is right !
====================================排序

能夠看到，當元素幾乎相同時（如第二個輸入，元素只有0和1），排序效率明顯很低。element

怎麼解決這個問題呢？quicksort的關鍵思想是divide-and-conquer，將原始序列分段（partition）從而讓問題規模指數級降低，從而達到快速排序的效果。因而，咱們對關鍵的partition這個方法進行微調。使得其效果以下。it

【小於pivot的元素集合】【L 等於pivot的元素集合 R】【大於pivot的元素集合】io

經過參數返回L和R。效率

pseudocode以下

partition(begin, end)

l = r = 0; pivot = a[begin];

for j <- begin+1 to end

if (a[j] == pivot)

exch(&a[j], &a[++r])

if (a[j] < pivot)

exch(&a[j], &a[++l])

exch(&a[j], &a[++r]

if (a[j] > pivot)

//nothing

return (l, r)

通過微調後，處理大量重複數據的效率大大提升（比處理不重複數據的效率高不少）；而處理幾乎不重複數據的效率略有降低，大約30%左右（由於本質上，關鍵的partition比原始的partition要多作大約1倍的交換）。

結果以下：

~/MyPro/Algorithms/sort $ ./quicksort2 1024 start sorting ... sorting finished! ==================================== Randomized Quicksort Sorting 1024 elements Time: 0s 707us The result is right ! ==================================== ~/MyPro/Algorithms/sort $ ./quicksort2 1024 1 start sorting ... sorting finished! ==================================== Randomized Quicksort Sorting 1024 elements Time: 0s 32us The result is right ! ====================================

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。