位圖索引(bitmap index)是從Oracle7.3版本開始引入的。目前Oracle企業版和我的版都支持位圖索引,但標準版不支持。位圖索引是爲數據倉庫/即席查詢環境設計的,在此全部查詢要求的數據在系統實現時根本不知道。位圖索引特別不適用於OLTP系統,若是系統中的數據會由多個併發會話頻繁地更新,這種系統也不適用位圖索引。sql
位圖索引是這樣一種結構,其中用一個索引鍵條目存儲指向多行的指針;這與B*樹結構不一樣,在B*樹結構中,索引鍵和表中的行存在着對應關係。在位圖索引中,可能只有不多的索引條目,每一個索引條目指向多行。而在傳統的B*樹中,一個索引條目就指向一行。數據庫
下面假設咱們要在EMP表的JOB列上建立一個位圖索引,以下:併發
system@ORCL>create BITMAP index job_idx on emp(job); 索引已建立。
Oracle 在索引中存儲的內容如表 11-6 所示。ide
表 11-6 Oracle 如何存儲 JOB-IDX 位圖索引函數
值/行spa |
1設計 |
2指針 |
3code |
4orm |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
ANALYST |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
1 |
0 |
CLERK |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
1 |
MANAGER |
0 |
0 |
0 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
PRESIDENT |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
SALESMAN |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
表11-6顯示了第八、10和13行的值爲ANALYST,而第四、6和7行的值爲MANAGER。在此還顯示了全部行都不爲null(位圖索引能夠存儲null條目;若是索引中沒有null條目,這說明表中沒有null行)。若是咱們想統計值爲MANAGER的行數,位圖索引就能很快地完成這個任務。若是咱們想找出JOB爲CLERK或MANAGER的全部行,只需根據索引合併它們的位圖,如表11-7所示。
表 11-7 位 OR 的表示
值/行 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
CLERK |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
1 |
MANAGER |
0 |
0 |
0 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
CLERK或MANAGER |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
1 |
1 |
0 |
1 |
表11-7清楚地顯示出,第一、四、六、七、十一、十二、14行知足咱們的要求。Oracle以下爲每一個鍵值存儲位圖,使得每一個位置表示底層表中的一個rowid,之後若是確實須要訪問行時,能夠利用這個rowid進行處理。對於如下查詢:
system@ORCL>select count(*) from emp where job = 'CLERK' or job = 'MANAGER'; COUNT(*) ---------- 7
用位圖索引就能直接得出答案。另外一方面,對於如下查詢:
system@ORCL>select * from emp where job = 'CLERK' or job = 'MANAGER'; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ---------- ---------- --------- ---------- -------------- ---------- ---------- ---------- 7369 SMITH CLERK 7902 17-12月-80 32387 20 7566 JONES MANAGER 7839 02-4月 -81 34562 20 7698 BLAKE MANAGER 7839 01-5月 -81 34437 30 7782 CLARK MANAGER 7839 09-6月 -81 34037 10 7876 ADAMS CLERK 7788 23-5月 -87 34321.35 20 7900 JAMES CLERK 7698 03-12月-81 32537 30 7934 MILLER CLERK 7782 23-1月 -82 32887 10 已選擇7行。
則須要訪問表。在此Oracle會應用一個函數把位圖中的第i位轉換爲一個rowid,從而可用於訪問表。
位圖索引對於相異基數(distinct cardinality)低的數據最爲合適(也就是說,與職工數據集的基數相比,這個數據只有不多幾個不一樣的值)。對此作出量化是不太可能的——換句話說,很難定義低相異基數究竟是多大。在一個有幾千條記錄的數據集中,2就是一個低相異基數,可是在一個只有兩行的表中,2就不能算是低相異基數了。而在一個有上千萬或上億條記錄的表中,甚至100,000都能做爲一個低相異基數。因此,多大才算是低相異基數,這要相對於結果集的大小來講。這是指,行集中不一樣項的個數除以行數應該是一個很小的數(接近於0)。例如,GENDER列可能取值爲M、F和NULL。若是一個表中有20,000條員工記錄,那麼3/20000=0.00015。相似地,若是有100,000個不一樣的值,與11.,000,000條結果相比,比值爲0.01,一樣這也很小(可算是低相異基數)。這些列就能夠創建位圖索引。它們可能不適合創建B*樹索引,由於每一個值可能會獲取表中的大量數據(佔很大百分比)。如前所述,B*樹索引通常來說應當是選擇性的。與之相反,位圖索引不該是選擇性的,通常來說它們應該「沒有選擇性「。
若是有大量即席查詢,特別是查詢以一種即席方式引用了多列或者會生成諸如COUNT之類的聚合,在這樣的環境中,位圖索引就特別有用。例如,假設你有一個很大的表,其中有3列:GENDER、LOCATION和AGE_GROUP。在這個表中,GENDER只有兩個可取值:M或F,LOCATION可取值爲11.50,AGE_GROUP是一個代碼,分別表示11. and under(11.及如下)、11.-2五、26-30、31-40和41 and over(41及以上)。
在一個數據倉庫或支持多個即席SQL查詢的大型報告系統中,能同時合理地使用盡量多的索引確實很是有用。
位圖索引在讀密集的環境中能很好地工做,可是對於寫密集的環境則極不適用。緣由在於,一個位圖索引鍵條目指向多行。若是一個會話修改了所索引的數據,那麼在大多數狀況下,這個索引條目指向的全部行都會被鎖定。Oracle無 法鎖定一個位圖索引條目中的單獨一位;而是會鎖定這個位圖索引條目。假若其餘修改也須要更新一樣的這個位圖索引條目,就會被「關在門外「。這樣將大大影響 併發性,由於每一個更新都有可能鎖定數百行,不容許併發地更新它們的位圖列。在此不是像你所想的那樣鎖定每一行,而是會鎖定不少行。
它容許使用另外某個表的列對一個給定表創建索引。實際上,這就容許對一個索引結構(而不是表自己)中的數據進行逆規範化。
考慮簡單的EMP表和DEPT表。EMP有指向DEPT的一個外鍵(DEPTNO列)。DEPT表有一個DNAME屬性(部門名)。
運行的查詢以下所示:
system@ORCL>select count(*) 2 from emp, dept 3 where emp.deptno = dept.deptno 4 and dept.dname = 'SALES' 5 / COUNT(*) ---------- 6 system@ORCL>select emp.* 2 from emp, dept 3 where emp.deptno = dept.deptno 4 and dept.dname = 'SALES' 5 / EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ---------- ---------- --------- ---------- -------------- ---------- ---------- ---------- 7499 ALLEN SALESMAN 7698 20-2月 -81 33187 300 30 7521 WARD SALESMAN 7698 22-2月 -81 32837 500 30 7654 MARTIN SALESMAN 7698 28-9月 -81 32837 1400 30 7698 BLAKE MANAGER 7839 01-5月 -81 34437 30 7844 TURNER SALESMAN 7698 08-9月 -81 33087 0 30 7900 JAMES CLERK 7698 03-12月-81 32537 30 已選擇6行。
利用位圖聯結索引,咱們能對DEPT.DNAME列創建索引,但這個索引不是指向DEPT表,而是指向EMP表。這是一個全新的概念:能從其餘表對某個表的屬性創建索引。
如下建立的索引:
system@ORCL>create bitmap index emp_bm_idx 2 on emp( d.dname ) 3 from emp e, dept d 4 where e.deptno = d.deptno 5 / 索引已建立。
它會在表上建立索引INDEX_NAME。在此引用了DEPT表中的一列:D.DNAME。這裏有一個FROM子句,使這個CREATE INDEX語句有些像查詢。另外,多個表之間有一個聯結條件。這個CREATE INDEX語句對DEPT.DNAME列創建了索引,但這在EMP表的上下文中。數據庫根本不會訪問DEPT,並且也不須要訪問DEPT,由於DNAME列如今是在指向EMP表中的行的索引中。爲了便於說明,咱們把EMP表和DEPT表製做得看上去很」大「(以免CBO認爲它們很小,以致於選擇執行全面掃描,而不是使用索引):
system@ORCL>begin 2 dbms_stats.set_table_stats( user, 'EMP', 3 numrows => 1000000, numblks => 300000 ); 4 dbms_stats.set_table_stats( user, 'DEPT', 5 numrows => 100000, numblks => 30000 ); 6 end; 7 / PL/SQL 過程已成功完成。
而後再執行查詢:
system@ORCL>set autotrace traceonly explain system@ORCL>select count(*) 2 from emp, dept 3 where emp.deptno = dept.deptno 4 and dept.dname = 'SALES' 5 / 執行計劃 ---------------------------------------------------------- Plan hash value: 2538954156 -------------------------------------------------------------------------------- ---------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | -------------------------------------------------------------------------------- ---------- | 0 | SELECT STATEMENT | | 1 | 3 | 1 (0)| 00:00:01 | | 1 | SORT AGGREGATE | | 1 | 3 | | | | 2 | BITMAP CONVERSION COUNT | | 333K| 976K| 1 (0)| 00:00:01 | |* 3 | BITMAP INDEX SINGLE VALUE| EMP_BM_IDX | | | | | -------------------------------------------------------------------------------- ---------- Predicate Information (identified by operation id): --------------------------------------------------- 3 - access("EMP"."SYS_NC00009$"='SALES')
system@ORCL>select emp.* 2 from emp, dept 3 where emp.deptno = dept.deptno 4 and dept.dname = 'SALES' 5 / 執行計劃 ---------------------------------------------------------- Plan hash value: 615168685 --------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 6249M| 296G| 133K (34)| 00:26:43 | |* 1 | HASH JOIN | | 6249M| 296G| 133K (34)| 00:26:43 | |* 2 | TABLE ACCESS FULL| DEPT | 25000 | 317K| 8143 (1)| 00:01:38 | | 3 | TABLE ACCESS FULL| EMP | 1000K| 36M| 81422 (1)| 00:16:18 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): --------------------------------------------------- 1 - access("EMP"."DEPTNO"="DEPT"."DEPTNO") 2 - filter("DEPT"."DNAME"='SALES')
位圖聯結索引確實有一個先決條件。聯結條件必須聯結到另外一個表中的主鍵或唯一鍵。