Oracle優化經典文章------索引原理篇

Oracle提供了大量索引選項。知道在給定條件下使用哪一個選項對於一個應用程序的性能來講很是重要。一個錯誤的選擇可能會引起死鎖,並致使數據庫性能急劇降低或進程終止。而若是作出正確的選擇,則能夠合理使用資源,使那些已經運行了幾個小時甚至幾天的進程在幾分鐘得以完成,這樣會使您馬上成爲一位英雄。這篇文章就將簡單的討論每一個索引選項。主要有如下內容: 
   
  [1] 基本的索引概念 
   
  查詢DBA_INDEXES視圖可獲得表中全部索引的列表,注意只能經過USER_INDEXES的方法來檢索模式(schema)的索引。訪問USER_IND_COLUMNS視圖可獲得一個給定表中被索引的特定列。 
   
  [2] 組合索引 
   
  當某個索引包含有多個已索引的列時,稱這個索引爲組合(concatented)索引。在 Oracle9i引入跳躍式掃描的索引訪問方法以前,查詢只能在有限條件下使用該索引。好比:表emp有一個組合索引鍵,該索引包含了empno、ename和deptno。在Oracle9i以前除非在where之句中對第一列(empno)指定一個值,不然就不能使用這個索引鍵進行一次範圍掃描。 
   
  特別注意:在Oracle9i以前,只有在使用到索引的前導索引時纔可使用組合索引! 
   
  [3] ORACLE ROWID 
   
  經過每一個行的ROWID,索引Oracle提供了訪問單行數據的能力。ROWID其實就是直接指向單獨行的線路圖。若是想檢查重複值或是其餘對ROWID自己的引用,能夠在任何表中使用和指定rowid列。 
   
  [4] 限制索引 
   
  限制索引是一些沒有經驗的開發人員常常犯的錯誤之一。在SQL中有不少陷阱會使一些索引沒法使用。下面討論一些常見的問題: 
   
  4.1 使用不等於操做符(<>、!=) 
   
  下面的查詢即便在cust_rating列有一個索引,查詢語句仍然執行一次全表掃描。 
   
  select cust_Id,cust_name 
  from  customers 
  where cust_rating <> 'aa'; 
   
  把上面的語句改爲以下的查詢語句,這樣,在採用基於規則的優化器而不是基於代價的優化器(更智能)時,將會使用索引。 
   
  select cust_Id,cust_name 
  from  customers 
  where cust_rating < 'aa' or cust_rating > 'aa'; 
   
  特別注意:經過把不等於操做符改爲OR條件,就可使用索引,以免全表掃描。 
   
  4.2 使用IS NULL 或IS NOT NULL 
   
  使用IS NULL 或IS NOT NULL一樣會限制索引的使用。由於NULL值並無被定義。在SQL語句中使用NULL會有不少的麻煩。所以建議開   發人員在建表時,把須要索引的列設成NOT NULL。若是被索引的列在某些行中存在NULL值,就不會使用這個索引(除非索引是一個位圖索   引,關於位圖索引在稍後在詳細討論)。 
   
  4.3 使用函數 
   
  若是不使用基於函數的索引,那麼在SQL語句的WHERE子句中對存在索引的列使用函數時,會使優化器忽略掉這些索引。 
   
  下面的查詢不會使用索引(只要它不是基於函數的索引) 
   
  select empno,ename,deptno 
  from  emp 
  where trunc(hiredate)='01-MAY-81'; 
   
  把上面的語句改爲下面的語句,這樣就能夠經過索引進行查找。 
   
  select empno,ename,deptno 
  from  emp 
  where hiredate<(to_date('01-MAY-81')+0.9999); 
   
  4.4 比較不匹配的數據類型 
   
  比較不匹配的數據類型也是比較難於發現的性能問題之一。 
   
  注意下面查詢的例子,account_number是一個VARCHAR2類型,在account_number字段上有索引。下面的語句將執行全表掃描。 
   
  select bank_name,address,city,state,zip 
  from  banks 
  where account_number = 990354; 
  Oracle能夠自動把where子句變成to_number(account_number)=990354,這樣就限制了索引的使用,改爲下面的查詢就可使用索引: 
  select bank_name,address,city,state,zip 
  from  banks 
  where account_number ='990354'; 
   
  特別注意:不匹配的數據類型之間比較會讓Oracle自動限制索引的使用,即使對這個查詢執行Explain Plan也不能讓您明白爲何作了一        次「全表掃描」。 
   
  [5] 選擇性 
   
  使用USER_INDEXES視圖,該視圖中顯示了一個distinct_keys列。比較一下惟一鍵的數量和表中的行數,就能夠判斷索引的選擇性。選擇性越高,索引返回的數據就越少。 
   
  [6] 羣集因子(Clustering Factor) 
   
  Clustering Factor位於USER_INDEXES視圖中。該列反映了數據相對於已索引的列是否顯得有序。若是Clustering Factor列的值接近於索引中的樹葉塊(leaf block)的數目,表中的數據就越有序。若是它的值接近於表中的行數,則表中的數據就不是頗有序。 
   
  [7] 二元高度(Binary height) 
   
  索引的二元高度對把ROWID返回給用戶進程時所要求的I/O量起到關鍵做用。在對一個索引進行分析後,能夠經過查詢DBA_INDEXES的B-level列查看它的二元高度。二元高度主要隨着表的大小以及被索引的列中值的範圍的狹窄程度而變化。索引上若是有大量被刪除的行,它的二元高度也會增長。更新索引列也相似於刪除操做,由於它增長了已刪除鍵的數目。重建索引可能會下降二元高度。 
   
  [8] 快速全局掃描 
   
  在Oracle7.3後就可使用快速全局掃描(Fast Full Scan)這個選項。這個選項容許Oracle執行一個全局索引掃描操做。快速全局掃描讀取B-樹索引上全部樹葉塊。初始化文件中的DB_FILE_MULTIBLOCK_READ_COUNT參數能夠控制同時被讀取的塊的數目。 
   
  [9] 跳躍式掃描 
   
  從Oracle9i開始,索引跳躍式掃描特性能夠容許優化器使用組合索引,即使索引的前導列沒有出如今WHERE子句中。索引跳躍式掃描比全索引掃描要快的多。下面的程序清單顯示出性能的差異: 
   
  create index skip1 on emp5(job,empno); 
  index created. 
   
  select count(*) 
  from emp5 
  where empno=7900; 
   
  Elapsed:00:00:03.13 
   
  Execution Plan 
  0   SELECT STATEMENT Optimizer=CHOOSE(Cost=4 Card=1 Bytes=5) 
  1 0  SORT(AGGREGATE) 
  2 1   INDEX(FAST FULL SCAN) OF 'SKIP1'(NON-UNIQUE) 
   
  Statistics 
   
  6826 consistent gets 
  6819 physical  reads 
   
  select /*+ index(emp5 skip1)*/ count(*) 
  from emp5 
  where empno=7900; 
   
  Elapsed:00:00:00.56 
   
  Execution Plan 
  0   SELECT STATEMENT Optimizer=CHOOSE(Cost=6 Card=1 Bytes=5) 
  1 0  SORT(AGGREGATE) 
  2 1   INDEX(SKIP SCAN) OF 'SKIP1'(NON-UNIQUE) 
   
  Statistics 
   
  21 consistent gets 
  17 physical  reads 
   
  [10] 索引的類型 
  B-樹索引 
  位圖索引 
  HASH索引 
  索引編排表 
  反轉鍵索引 
  基於函數的索引 
  分區索引 
  本地和全局索引 


================= 

避免全表掃描數據庫

相關文章
相關標籤/搜索