一 表空間及分區表的概念
表空間:
是一個或多個數據文件的集合,全部的數據對象都存放在指定的表空間中,但主要存放的是表, 因此稱做表空間。
分區表:
當表中的數據量不斷增大,查詢數據的速度就會變慢,應用程序的性能就會降低,這時就應該考慮對錶進行分區。表進行分區後,邏輯上表仍然是一張完整的表,只是將表中的數據在物理上存放到多個表空間(物理文件上),這樣查詢數據時,不至於每次都掃描整張表。
二 表分區的具體做用
Oracle的表分區功能經過改善可管理性、性能和可用性,從而爲各式應用程序帶來了極大的好處。一般,分區可使某些查詢以及維護操做的性能大大提升。此外,分區還能夠極大簡化常見的管理任務,分區是構建千兆字節數據系統或超高可用性系統的關鍵工具。
分區功能可以將表、索引或索引組織表進一步細分爲段,這些數據庫對象的段叫作分區。每一個分區有本身的名稱,還能夠選擇本身的存儲特性。從數據庫管理員的角度來看,一個分區後的對象具備多個段,這些段既可進行集體管理,也可單獨管理,這就使數據庫管理員在管理分區後的對象時有至關大的靈活性。可是,從應用程序的角度來看,分區後的表與非分區表徹底相同,使用 SQL DML 命令訪問分區後的表時,無需任何修改。
何時使用分區表:
一、表的大小超過2GB。
二、表中包含歷史數據,新的數據被增長都新的分區中。
三 表分區的優缺點
表分區有如下優勢:
一、改善查詢性能:對分區對象的查詢能夠僅搜索本身關心的分區,提升檢索速度。
二、加強可用性:若是表的某個分區出現故障,表在其餘分區的數據仍然可用;
三、維護方便:若是表的某個分區出現故障,須要修復數據,只修復該分區便可;
四、均衡I/O:能夠把不一樣的分區映射到磁盤以平衡I/O,改善整個系統性能。
缺點:
分區表相關:已經存在的表沒有方法能夠直接轉化爲分區表。不過 Oracle 提供了在線重定義表的功能。
四 表分區的幾種類型及操做方法
4.1 範圍分區
範圍分區將數據基於範圍映射到每個分區,這個範圍是你在建立分區時指定的分區鍵決定的。這種分區方式是最爲經常使用的,而且分區鍵常常採用日期。舉個例子:你可能會將銷售數據按照月份進行分區。算法
當使用範圍分區時,請考慮如下幾個規則:
一、每個分區都必須有一個VALUES LESS THEN子句,它指定了一個不包括在該分區中的上限值。分區鍵的任何值等於或者大於這個上限值的記錄都會被加入到下一個高一些的分區中。
二、全部分區,除了第一個,都會有一個隱式的下限值,這個值就是此分區的前一個分區的上限值。
三、在最高的分區中,MAXVALUE被定義。MAXVALUE表明了一個不肯定的值。這個值高於其它分區中的任何分區鍵的值,也能夠理解爲高於任何分區中指定的VALUE LESS THEN的值,同時包括空值。
例一:
假設有一個CUSTOMER表,表中有數據200000行,咱們將此表經過CUSTOMER_ID進行分區,每一個分區存儲100000行,咱們將每一個分區保存到單獨的表空間中,這樣數據文件就能夠跨越多個物理磁盤。下面是建立表和分區的代碼,以下:
CREATE TABLE CUSTOMER
(
CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
FIRST_NAME VARCHAR2(30) NOT NULL,
LAST_NAME VARCHAR2(30) NOT NULL,
PHONE VARCHAR2(15) NOT NULL,
EMAIL VARCHAR2(80),
STATUS CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
)
例二:按時間劃分數據庫
CREATE TABLE ORDER_ACTIVITIES
(
ORDER_ID NUMBER(7) NOT NULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(7),
PAID CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
)
例三:MAXVALUE
CREATE TABLE RangeTable
(
idd INT PRIMARY KEY ,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
);
4.2列表分區:
該分區的特色是某列的值只有幾個,基於這樣的特色咱們能夠採用列表分區。
例一
CREATE TABLE PROBLEM_TICKETS
(
PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,
DESCRIPTION VARCHAR2(2000),
CUSTOMER_ID NUMBER(7) NOT NULL,
DATE_ENTERED DATE NOT NULL,
STATUS VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01,
PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02
例二
CREATE TABLE ListTable
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
);
)
4.3 散列分區:
這類分區是在列值上使用散列算法,以肯定將行放入哪一個分區中。當列的值沒有合適的條件時,建議使用散列分區。
散列分區爲經過指定分區編號來均勻分佈數據的一種分區類型,由於經過在I/O設備上進行散列分區,使得這些分區大小一致。
例一:
CREATE TABLE HASH_TABLE
(
COL NUMBER(8),
INF VARCHAR2(100)
)
PARTITION BY HASH (COL)
(
PARTITION PART01 TABLESPACE HASH_TS01,
PARTITION PART02 TABLESPACE HASH_TS02,
PARTITION PART03 TABLESPACE HASH_TS03
)
簡寫:
CREATE TABLE emp
(
empno NUMBER (4),
ename VARCHAR2 (30),
sal NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);
hash分區最主要的機制是根據hash算法來計算具體某條紀錄應該插入到哪一個分區中,hash算法中最重要的是hash函數,Oracle中若是你要使用hash分區,只需指定分區的數量便可。建議分區的數量採用2的n次方,這樣可使得各個分區間數據分佈更加均勻。
4.4 組合範圍散列分區
這種分區是基於範圍分區和列表分區,表首先按某列進行範圍分區,而後再按某列進行列表分區,分區之中的分區被稱爲子分區。
CREATE TABLE SALES
(
PRODUCT_ID VARCHAR2(5),
SALES_DATE DATE,
SALES_COST NUMBER(10),
STATUS VARCHAR2(20)
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
(
PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
(
SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
),
PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
(
SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
)
)
4.5 複合範圍散列分區:
這種分區是基於範圍分區和散列分區,表首先按某列進行範圍分區,而後再按某列進行散列分區。
create table dinya_test
(
transaction_id number primary key,
item_id number(8) not null,
item_description varchar2(300),
transaction_date date
)
partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
(
partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)),
partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)),
partition part_03 values less than(maxvalue)
);
五 有關表分區的一些維護性操做:
5.1 添加分區
如下代碼給SALES表添加了一個P3分區
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意:以上添加的分區界限應該高於最後一個分區界限。
如下代碼給SALES表的P3分區添加了一個P3SUB1子分區
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
5.2 刪除分區
如下代碼刪除了P3表分區:
ALTER TABLE SALES DROP PARTITION P3;
在如下代碼刪除了P4SUB1子分區:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意:若是刪除的分區是表中惟一的分區,那麼此分區將不能被刪除,要想刪除此分區,必須刪除表。
5.3 截斷分區
截斷某個分區是指刪除某個分區中的數據,並不會刪除分區,也不會刪除其它分區中的數據。當表中即便只有一個分區時,也能夠截斷該分區。經過如下代碼截斷分區:
ALTER TABLE SALES TRUNCATE PARTITION P2;
經過如下代碼截斷子分區:
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
5.4 合併分區
合併分區是將相鄰的分區合併成一個分區,結果分區將採用較高分區的界限,值得注意的是,不能將分區合併到界限較低的分區。如下代碼實現了P1 P2分區的合併:
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
5.5 拆分分區
拆分分區將一個分區拆分兩個新分區,拆分後原來分區再也不存在。注意不能對HASH類型的分區進行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
5.6 接合分區(coalesca)
結合分區是將散列分區中的數據接合到其它分區中,當散列分區中的數據比較大時,能夠增長散列分區,而後進行接合,值得注意的是,接合分區只能用於散列分區中。經過如下代碼進行接合分區:
ALTER TABLE SALES COALESCA PARTITION;
5.7 重命名錶分區
如下代碼將P21更改成P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;
5.8 相關查詢
跨分區查詢
select sum( *) from
(select count(*) cn from t_table_SS PARTITION (P200709_1)
union all
select count(*) cn from t_table_SS PARTITION (P200709_2)
);
查詢表上有多少分區
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'
查詢索引信息
select object_name,object_type,tablespace_name,sum(value)
from v$segment_statistics
where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
group by object_name,object_type,tablespace_name
order by 4 desc
--顯示數據庫全部分區表的信息:
select * from DBA_PART_TABLES
--顯示當前用戶可訪問的全部分區表信息:
select * from ALL_PART_TABLES
--顯示當前用戶全部分區表的信息:
select * from USER_PART_TABLES
--顯示錶分區信息 顯示數據庫全部分區表的詳細分區信息:
select * from DBA_TAB_PARTITIONS
--顯示當前用戶可訪問的全部分區表的詳細分區信息:
select * from ALL_TAB_PARTITIONS
--顯示當前用戶全部分區表的詳細分區信息:
select * from USER_TAB_PARTITIONS
--顯示子分區信息 顯示數據庫全部組合分區表的子分區信息:
select * from DBA_TAB_SUBPARTITIONS
--顯示當前用戶可訪問的全部組合分區表的子分區信息:
select * from ALL_TAB_SUBPARTITIONS
--顯示當前用戶全部組合分區表的子分區信息:
select * from USER_TAB_SUBPARTITIONS
--顯示分區列 顯示數據庫全部分區表的分區列信息:
select * from DBA_PART_KEY_COLUMNS
--顯示當前用戶可訪問的全部分區表的分區列信息:
select * from ALL_PART_KEY_COLUMNS
--顯示當前用戶全部分區表的分區列信息:
select * from USER_PART_KEY_COLUMNS
--顯示子分區列 顯示數據庫全部分區表的子分區列信息:
select * from DBA_SUBPART_KEY_COLUMNS
--顯示當前用戶可訪問的全部分區表的子分區列信息:
select * from ALL_SUBPART_KEY_COLUMNS
--顯示當前用戶全部分區表的子分區列信息:
select * from USER_SUBPART_KEY_COLUMNS
--怎樣查詢出oracle數據庫中全部的的分區表
select * from user_tables a where a.partitioned='YES'
--刪除一個表的數據是
truncate table table_name;
--刪除分區表一個分區的數據是
alter table table_name truncate partition p5;
六 、分區表的索引
對於分區表,能夠創建不分區索引。也就是說表分區,可是索引不分區。如下着重介紹分區表的分區索引。oracle
索引與表同樣,也能夠分區。索引分爲兩類:locally partition index(局部分區索引)、globally partition index(全局分區索引)。less
6.1. 局部分區索引(locally partition index)
局部分區索引隨表對索引完成相應的分區,即索引會使用與表相同的機制進行分區,每一個表分區都有一個索引分區,而且只索引該表分區。函數
6.1.1 局部索引分類
▶ 局部前綴索引(local prefixed index):以分區鍵做爲索引定義的第一列工具
▶ 局部非前綴索引(local nonprefixed index):分區鍵沒有做爲索引定義的第一列post
注意:判斷局部索引是前綴仍是非前綴的只須要看分區鍵是否做爲索引定義的第一列性能
示例語句spa
--範圍分區
--建立表
create table student_range_part(
stu_id varchar2(4),
stu_name varchar2(100), --姓名
sex varchar2(1), --性別 1 男 2 女 0 未知
credit integer default 0
)
partition by range (credit)
(
partition student_part1 values less than (60) tablespace kdhist_data,
partition student_part2 values less than (70) tablespace kdhist_data,
partition student_part3 values less than (80) tablespace kdhist_data,
partition student_part4 values less than (maxvalue) tablespace kdhist_data
);
--建立局部前綴索引;分區鍵(credit)做爲索引定義的第一列
create index local_prefixed_index on student_range_part (credit, stu_id) local;
--建立局部非前綴索引;分區鍵未做爲索引定義的第一列
create index local_nonprefixed_index on student_range_part (stu_id, credit) local;
6.1.2 局部索引示例
--①
select * from student_range_part where credit = &credit and stu_id = &stu_id;
--②
select * from student_range_part where stu_id = &stu_id;
對於以上兩個查詢來講,若是查詢第一步是走索引的話,則:
局部前綴索引 local_prefixed_index 只對 ① 有用;
局部非前綴索引 local_nonprefixed_index 則對 ① 和 ② 均有用;
若是你有多個相似 ① 和 ② 的查詢的話,則能夠考慮創建局部非前綴索引;若是日常多使用查詢 ① 的話,則能夠考慮創建局部前綴索引;
小結:
分區表通常使用局部索引。重點在於如何選擇分區表和局部索引類型。
6.2. 全局分區索引(globally partition index)
索引按範圍(Range)或散列(Hash,Oracle 10g中引入)進行分區,一個分區索引(全局)可能指向任何(或所有的)表分區。
對於全局分區索引來講,索引的實際分區數可能不一樣於表的分區數量;
全局索引的分區機制有別於底層表,例如表能夠按 credit 列劃分爲10個分區,表上的一個全局索引能夠按stu_id 列劃分爲5個分區。
與局部索引不一樣,全局索引只有一類,即全局前綴索引(prefixed global index),索引分區鍵必須做爲索引定義的第一列,不然執行會報錯。
--範圍分區
--建立表
create table student_range_part(
stu_id varchar2(4),
stu_name varchar2(100), --姓名
sex varchar2(1), --性別 1 男 2 女 0 未知
credit integer default 0
)
partition by range (credit)
(
partition student_part1 values less than (60) tablespace kdhist_data,
partition student_part2 values less than (70) tablespace kdhist_data,
partition student_part3 values less than (80) tablespace kdhist_data,
partition student_part4 values less than (maxvalue) tablespace kdhist_data
);
--建立按age進行範圍分區的全局分區索引
create index global_index on student_range_part(credit) global
partition by range (credit)
(
partition index_part1 values less than (60),
partition index_part2 values less than (80),
partition index_partmax values less than (maxvalue)
);
注意:
全局索引要求最高分區(即最後一個分區)必須有一個值爲 maxvalue 的最大上限值,這樣能夠確保底層表的全部行都能放在這個索引中;
通常狀況下,大多數分區操做(如刪除一箇舊分區)都會使全局索引無效,除非重建全局索引,不然沒法使用
全局索引示例
全局索引通常用於數據倉庫,許多數據倉庫系統都存在大量的數據出入,如典型的數據「滑入滑出」(即刪除表中最舊的分區,併爲新加載的數據增長一個新分區)。
① 去除老數據:最舊的分區要麼被刪除,要麼建立一個新表,將最舊的分區數據存入,從而對舊數據進行歸檔;
② 加載新數據並創建索引:將新數據加載到一個「工做」表中,創建索引並進行驗證;
③ 關聯新數據:一旦加載並處理了新數據,數據所在的表會與分區表中的一個空分區交換,將表中的這些新加載的數據變成分區表中的一個分區(分區表會變得更大)
對於全局索引來講,這樣增刪分區的過程,意味着該全局索引的失效,需重建全局索引;
在 Oracle 9i 以後,能夠在分區操做期間使用 UPDATE GLOBAL INEXES 子句來維護全局索引,這意味着當在分區上執行刪除、分解或其餘操做時,Oracle會對原先創建的全局索引執行必要的修改,以保證它是最新的。
--刪除student_range_part表中的index_part1分區,同時同步維護全局索引
alter table student_range_part drop partition index_part1 update global indexes;
使用 UPDATE GLOBAL INEXES子句後,在刪除一個分區時,必須刪除可能指向該分區的全部全局索引條目;
執行表與分區的交換時,必須刪除指向原數據的全部全局索引條目,再插入指向剛加載的數據的新條目;
如此一來 ALTER 命令執行的工做量會大幅增長;
小結:
分區操做執行完成後重建全局索引方式佔用的數據庫資源更少,所以完成的相對「更快」,可是會帶來顯著的「停機時間」(重建索引時會有一個可觀的不可用窗口);
在分區操做執行的同時執行 UPDATE GLOBAL INDEXES 子句方式會佔用更多的資源,且可能須要花費更長的時間才能完成操做,但好處是不會帶來任何的停機時間。
即便是數據倉庫,除非特殊需求,不然這個建立局部索引便可。