堆初始化 堆排序

    轉自http://www.cnblogs.com/mengdd/archive/2012/11/30/2796845.html

 堆排序是一種選擇排序,其時間複雜度爲O(nlogn)。

堆的定義

  n個元素的序列{k1,k2,…,kn}當且僅當滿足下列關係之一時,稱之爲堆。

  情形1:k<= k2i 且k<= k2i+1 最小化堆小頂堆

  情形2:k>= k2i 且k>= k2i+1 (最大化堆大頂堆

  其中i=1,2,…,n/2向下取整;

     

                 

 

  若將和此序列對應的一維數組(即以一維數組作此序列的存儲結構)看成是一個完全二叉樹,則堆的含義表明,完全二叉樹中所有非終端結點的值均不大於(或不小於)其左、右孩子結點的值

  由此,若序列{k1,k2,…,kn}是堆,則堆頂元素(或完全二叉樹的根)必爲序列中n個元素的最小值(或最大值)。

  例如,下列兩個序列爲堆,對應的完全二叉樹如圖:

  

 

  若在輸出堆頂的最小值之後,使得剩餘n-1個元素的序列重又建成一個堆,則得到n個元素的次小值。如此反覆執行,便能得到一個有序序列,這個過程稱之爲堆排序

  堆排序(Heap Sort)只需要一個記錄元素大小的輔助空間(供交換用),每個待排序的記錄僅佔有一個存儲空間。

 

堆的存儲

  一般用數組來表示堆,若根結點存在序號0處, i結點的父結點下標就爲(i-1)/2。i結點的左右子結點下標分別爲2*i+12*i+2

  (注:如果根結點是從1開始,則左右孩子結點分別是2i和2i+1。)

  如第0個結點左右子結點下標分別爲1和2。

  如最大化堆如下:

   

 

  左圖爲其存儲結構,右圖爲其邏輯結構。

堆排序的實現

  實現堆排序需要解決兩個問題:

    1.如何由一個無序序列建成一個堆?

    2.如何在輸出堆頂元素之後,調整剩餘元素成爲一個新的堆?

 

  先考慮第二個問題,一般在輸出堆頂元素之後,視爲將這個元素排除,然後用表中最後一個元素填補它的位置,自上向下進行調整:首先將堆頂元素和它的左右子樹的根結點進行比較,把最小的元素交換到堆頂;然後順着被破壞的路徑一路調整下去,直至葉子結點,就得到新的堆。

  我們稱這個自堆頂至葉子的調整過程爲「篩選」。

  從無序序列建立堆的過程就是一個反覆「篩選」的過程。

構造初始堆

  初始化堆的時候是對所有的非葉子結點進行篩選。

  最後一個非終端元素的下標是[n/2]向下取整,所以篩選只需要從第[n/2]向下取整個元素開始,從後往前進行調整。

  比如,給定一個數組,首先根據該數組元素構造一個完全二叉樹。

  然後從最後一個非葉子結點開始,每次都是從父結點、左孩子、右孩子中進行比較交換,交換可能會引起孩子結點不滿足堆的性質,所以每次交換之後需要重新對被交換的孩子結點進行調整。

進行堆排序

  有了初始堆之後就可以進行排序了。

  堆排序是一種選擇排序。建立的初始堆爲初始的無序區。

  排序開始,首先輸出堆頂元素(因爲它是最值),將堆頂元素和最後一個元素交換,這樣,第n個位置(即最後一個位置)作爲有序區,前n-1個位置仍是無序區,對無序區進行調整,得到堆之後,再交換堆頂和最後一個元素,這樣有序區長度變爲2。。。

  不斷進行此操作,將剩下的元素重新調整爲堆,然後輸出堆頂元素到有序區。每次交換都導致無序區-1,有序區+1。不斷重複此過程直到有序區長度增長爲n-1,排序完成。

堆排序實例

   首先,建立初始的堆結構如圖:

  

  然後,交換堆頂的元素和最後一個元素,此時最後一個位置作爲有序區(有序區顯示爲黃色),然後進行其他無序區的堆調整,重新得到大頂堆後,交換堆頂和倒數第二個元素的位置……

  

  重複此過程:

  

 

  最後,有序區擴展完成即排序完成:

  

 

  由排序過程可見,若想得到升序,則建立大頂堆,若想得到降序,則建立小頂堆

代碼

  假設排列的元素爲整型,且元素的關鍵字爲其本身。

  因爲要進行升序排列,所以用大頂堆。

  根結點從0開始,所以i結點的左右孩子結點的下標爲2i+1和2i+2。

 

複製代碼
//堆篩選函數
//已知H[start~end]中除了start之外均滿足堆的定義
//本函數進行調整,使H[start~end]成爲一個大頂堆
typedef int ElemType;
void HeapAdjust(ElemType H[], int start, int end)
{

    ElemType temp = H[start];

    for(int i = 2*start + 1; i<=end; i*=2)
    {
        //因爲假設根結點的序號爲0而不是1,所以i結點左孩子和右孩子分別爲2i+1和2i+2
        if(i<end && H[i]<H[i+1])//左右孩子的比較
        {
            ++i;//i爲較大的記錄的下標
        }

        if(temp > H[i])//左右孩子中獲勝者與父親的比較
        {
            break;
        }

        //將孩子結點上位,則以孩子結點的位置進行下一輪的篩選
        H[start]= H[i];
        start = i;
        
    }

    H[start]= temp; //插入最開始不和諧的元素
}

void HeapSort(ElemType A[], int n)
{
    //先建立大頂堆
    for(int i=n/2; i>=0; --i)
    {
        HeapAdjust(A,i,n);
    }
    //進行排序
    for(int i=n-1; i>0; --i)
    {
        //最後一個元素和第一元素進行交換
        ElemType temp=A[i];
        A[i] = A[0];
        A[0] = temp;

        //然後將剩下的無序元素繼續調整爲大頂堆
        HeapAdjust(A,0,i-1);
    }

}
複製代碼

 

堆排序分析

  堆排序方法對記錄數較少的文件並不值得提倡,但對n較大的文件還是很有效的。因爲其運行時間主要耗費在建初始堆和調整建新堆時進行的反覆「篩選」上。

  堆排序在最壞的情況下,其時間複雜度也爲O(nlogn)。相對於快速排序來說,這是堆排序的最大優點。此外,堆排序僅需一個記錄大小的供交換用的輔助存儲空間。

 

  參考資料:

  嚴蔚敏《數據結構》

  http://www.cnblogs.com/dolphin0520/archive/2011/10/06/2199741.html

  http://blog.csdn.net/morewindows/article/details/6709644