轉自http://www.cnblogs.com/mengdd/archive/2012/11/30/2796845.html
堆排序是一種選擇排序,其時間複雜度爲O(nlogn)。
堆的定義
n個元素的序列{k1,k2,…,kn}當且僅當滿足下列關係之一時,稱之爲堆。
情形1:ki <= k2i 且ki <= k2i+1 (最小化堆或小頂堆)
情形2:ki >= k2i 且ki >= k2i+1 (最大化堆或大頂堆)
其中i=1,2,…,n/2向下取整;
若將和此序列對應的一維數組(即以一維數組作此序列的存儲結構)看成是一個完全二叉樹,則堆的含義表明,完全二叉樹中所有非終端結點的值均不大於(或不小於)其左、右孩子結點的值。
由此,若序列{k1,k2,…,kn}是堆,則堆頂元素(或完全二叉樹的根)必爲序列中n個元素的最小值(或最大值)。
例如,下列兩個序列爲堆,對應的完全二叉樹如圖:
若在輸出堆頂的最小值之後,使得剩餘n-1個元素的序列重又建成一個堆,則得到n個元素的次小值。如此反覆執行,便能得到一個有序序列,這個過程稱之爲堆排序。
堆排序(Heap Sort)只需要一個記錄元素大小的輔助空間(供交換用),每個待排序的記錄僅佔有一個存儲空間。
一般用數組來表示堆,若根結點存在序號0處, i結點的父結點下標就爲(i-1)/2。i結點的左右子結點下標分別爲2*i+1和2*i+2。
(注:如果根結點是從1開始,則左右孩子結點分別是2i和2i+1。)
如第0個結點左右子結點下標分別爲1和2。
如最大化堆如下:
左圖爲其存儲結構,右圖爲其邏輯結構。
實現堆排序需要解決兩個問題:
1.如何由一個無序序列建成一個堆?
2.如何在輸出堆頂元素之後,調整剩餘元素成爲一個新的堆?
先考慮第二個問題,一般在輸出堆頂元素之後,視爲將這個元素排除,然後用表中最後一個元素填補它的位置,自上向下進行調整:首先將堆頂元素和它的左右子樹的根結點進行比較,把最小的元素交換到堆頂;然後順着被破壞的路徑一路調整下去,直至葉子結點,就得到新的堆。
我們稱這個自堆頂至葉子的調整過程爲「篩選」。
從無序序列建立堆的過程就是一個反覆「篩選」的過程。
初始化堆的時候是對所有的非葉子結點進行篩選。
最後一個非終端元素的下標是[n/2]向下取整,所以篩選只需要從第[n/2]向下取整個元素開始,從後往前進行調整。
比如,給定一個數組,首先根據該數組元素構造一個完全二叉樹。
然後從最後一個非葉子結點開始,每次都是從父結點、左孩子、右孩子中進行比較交換,交換可能會引起孩子結點不滿足堆的性質,所以每次交換之後需要重新對被交換的孩子結點進行調整。
有了初始堆之後就可以進行排序了。
堆排序是一種選擇排序。建立的初始堆爲初始的無序區。
排序開始,首先輸出堆頂元素(因爲它是最值),將堆頂元素和最後一個元素交換,這樣,第n個位置(即最後一個位置)作爲有序區,前n-1個位置仍是無序區,對無序區進行調整,得到堆之後,再交換堆頂和最後一個元素,這樣有序區長度變爲2。。。
不斷進行此操作,將剩下的元素重新調整爲堆,然後輸出堆頂元素到有序區。每次交換都導致無序區-1,有序區+1。不斷重複此過程直到有序區長度增長爲n-1,排序完成。
首先,建立初始的堆結構如圖:
然後,交換堆頂的元素和最後一個元素,此時最後一個位置作爲有序區(有序區顯示爲黃色),然後進行其他無序區的堆調整,重新得到大頂堆後,交換堆頂和倒數第二個元素的位置……
重複此過程:
最後,有序區擴展完成即排序完成:
由排序過程可見,若想得到升序,則建立大頂堆,若想得到降序,則建立小頂堆。
假設排列的元素爲整型,且元素的關鍵字爲其本身。
因爲要進行升序排列,所以用大頂堆。
根結點從0開始,所以i結點的左右孩子結點的下標爲2i+1和2i+2。
//堆篩選函數 //已知H[start~end]中除了start之外均滿足堆的定義 //本函數進行調整,使H[start~end]成爲一個大頂堆 typedef int ElemType; void HeapAdjust(ElemType H[], int start, int end) { ElemType temp = H[start]; for(int i = 2*start + 1; i<=end; i*=2) { //因爲假設根結點的序號爲0而不是1,所以i結點左孩子和右孩子分別爲2i+1和2i+2 if(i<end && H[i]<H[i+1])//左右孩子的比較 { ++i;//i爲較大的記錄的下標 } if(temp > H[i])//左右孩子中獲勝者與父親的比較 { break; } //將孩子結點上位,則以孩子結點的位置進行下一輪的篩選 H[start]= H[i]; start = i; } H[start]= temp; //插入最開始不和諧的元素 } void HeapSort(ElemType A[], int n) { //先建立大頂堆 for(int i=n/2; i>=0; --i) { HeapAdjust(A,i,n); } //進行排序 for(int i=n-1; i>0; --i) { //最後一個元素和第一元素進行交換 ElemType temp=A[i]; A[i] = A[0]; A[0] = temp; //然後將剩下的無序元素繼續調整爲大頂堆 HeapAdjust(A,0,i-1); } }
堆排序方法對記錄數較少的文件並不值得提倡,但對n較大的文件還是很有效的。因爲其運行時間主要耗費在建初始堆和調整建新堆時進行的反覆「篩選」上。
堆排序在最壞的情況下,其時間複雜度也爲O(nlogn)。相對於快速排序來說,這是堆排序的最大優點。此外,堆排序僅需一個記錄大小的供交換用的輔助存儲空間。
參考資料:
嚴蔚敏《數據結構》
http://www.cnblogs.com/dolphin0520/archive/2011/10/06/2199741.html