快速排序到底有多快？

時間 2019-12-07

標籤快速排序到底多快简体版

原文原文鏈接

上期爲你們介紹了快速排序（Quicksort），有不少同窗會問：快排是否是比以前幾種排序都要快？它到底有多快？，那就讓咱們一塊兒來作個小實驗測試一下吧！python

1、實驗設計

目前給你們介紹過了6種排序：冒泡排序、選擇排序、插入排序、希爾排序、歸併排序、快速排序，而且在上期講快速排續時給出了快排的優化方案：對於大數據集排序先使用快排，當分區達到必定小的時候使用插入排序，有同窗就有疑惑：爲何當分區達到必定小時要用插入排序，這樣真的會變快嗎？算法

1.實驗排序算法

冒泡排序、選擇排序、插入排序、希爾排序、歸併排序、快速排序shell

2.數據集規模

隨機生成一個數據集，數據個數從10，100，1000依次遞增到10萬個緩存

3.比較方法

比較每一個排序算法所用時長，屢次測試，減小偏差性能

4.數據特徵

首先對隨機數進行排序，看看哪一個排序方法較快；而後再對「基本有序」的數據集排序，再比較這幾種排序方法用時。測試

2、實驗代碼

使用randint隨機生成整數大數據

1.隨機數排序

if __name__ == '__main__':
    # 生成n個0-10萬的隨機整型數據
    n = 100000	#n in [10, 100, 1000, 10000, 100000]
    arr = [randint(0, 100000) for i in range(n)]
    
    start1 = time.time()
    # 使用deepcopy是爲了排除電腦或程序自動優化或使用緩存等因素
    bubble_sort(deepcopy(arr))
    print("冒泡排序耗時：" + str(time.time() - start1))

    start2 = time.time()
    selection_sort(deepcopy(arr))
    print("選擇排序耗時：" + str(time.time() - start2))

    start3 = time.time()
    insertion_sort(deepcopy(arr))
    print("插入排序耗時：" + str(time.time() - start3))

    start4 = time.time()
    shell_sort(deepcopy(arr))
    print("希爾排序耗時：" + str(time.time() - start4))

    start5 = time.time()
    merge_sort(deepcopy(arr))
    print("歸併排序耗時：" + str(time.time() - start5))

    start6 = time.time()
    quick_sort(deepcopy(arr))
    print("快速排序耗時：" + str(time.time()-start6))

2.基本有序數據排序

數據集生成的基本思路：先生成一個有序數列，而後將少許數據插入有序數列中，這裏取0.1*n個亂序插入到0.9*n個有序數列中。優化

if __name__ == '__main__':
    # 生成n個0-10萬的基本有序的整型數據
    n = 10  # n in [10, 100, 1000, 10000, 100000]
    n1 = int(n * 0.9)
    n2 = n - n1
    arr = [i for i in range(n1)]
    for i in range(n1, n):
        arr.insert(randint(0, n1 - 1), i)

    start1 = time.time()
    bubble_sort(deepcopy(arr))
    print("冒泡排序耗時：" + str(time.time() - start1))

    start2 = time.time()
    selection_sort(deepcopy(arr))
    print("選擇排序耗時：" + str(time.time() - start2))

    start3 = time.time()
    insertion_sort(deepcopy(arr))
    print("插入排序耗時：" + str(time.time() - start3))

    start4 = time.time()
    shell_sort(deepcopy(arr))
    print("希爾排序耗時：" + str(time.time() - start4))

    start5 = time.time()
    merge_sort(deepcopy(arr))
    print("歸併排序耗時：" + str(time.time() - start5))

    start6 = time.time()
    quick_sort(deepcopy(arr))
    print("快速排序耗時：" + str(time.time() - start6))

3、實驗結果

時間單位是秒，屢次測試結果基本差很少，這裏豬哥隨機選取依次測試結果，全場敷冰進行，請勿模仿：ui

1.隨機數排序結果

n=10

冒泡排序耗時：2.4080276489257812e-05 選擇排序耗時：1.9311904907226562e-05 插入排序耗時：1.5020370483398438e-05 希爾排序耗時：1.5974044799804688e-05 歸併排序耗時：2.8848648071289062e-05 快速排序耗時：1.9073486328125e-05.net

n=100

冒泡排序耗時：0.000782012939453125 選擇排序耗時：0.0004570484161376953 插入排序耗時：0.00039076805114746094 希爾排序耗時：0.00018095970153808594 歸併排序耗時：0.0003409385681152344 快速排序耗時：0.00017905235290527344

n=1000

冒泡排序耗時：0.08327889442443848 選擇排序耗時：0.03776884078979492 插入排序耗時：0.04986977577209473 希爾排序耗時：0.0034036636352539062 歸併排序耗時：0.005920886993408203 快速排序耗時：0.0021750926971435547

n=10000

冒泡排序耗時：8.781844854354858 選擇排序耗時：3.438148021697998 插入排序耗時：4.186453819274902 希爾排序耗時：0.05663800239562988 歸併排序耗時：0.06386470794677734 快速排序耗時：0.02335190773010254

n=100000

冒泡排序耗時：900.5480690002441 選擇排序耗時：879.1669909954071 插入排序耗時：428.66180515289307 希爾排序耗時：0.967015266418457 歸併排序耗時：1.4872560501098633 快速排序耗時：0.3050980567932129

n=1000000

再通過幾小時等待後，我彷彿聞到一股燒焦的味道，真香～

2.基本有序數據排序結果

n=10

冒泡排序耗時：2.288818359375e-05 選擇排序耗時：1.9788742065429688e-05 插入排序耗時：1.3113021850585938e-05 希爾排序耗時：1.5974044799804688e-05 歸併排序耗時：2.9087066650390625e-05 快速排序耗時：1.811981201171875e-05

n=100

冒泡排序耗時：0.0004851818084716797 選擇排序耗時：0.0004131793975830078 插入排序耗時：0.00013065338134765625 希爾排序耗時：0.00015997886657714844 歸併排序耗時：0.00032019615173339844 快速排序耗時：0.00015974044799804688

n=1000

冒泡排序耗時：0.05040717124938965 選擇排序耗時：0.03394508361816406 插入排序耗時：0.009570121765136719 希爾排序耗時：0.0029370784759521484 歸併排序耗時：0.005821943283081055 快速排序耗時：0.0022530555725097656

n=10000

冒泡排序耗時：5.24026083946228 選擇排序耗時：3.340329885482788 插入排序耗時：0.8101489543914795 希爾排序耗時：0.04622912406921387 歸併排序耗時：0.05988883972167969 快速排序耗時：0.023930788040161133