mysql的分區跟分表

mysql的分區和分表mysql

分區程序員

分區就是把一個數據表的文件和索引分散存儲在不一樣的物理文件中。sql

 


 

mysql支持的分區類型包括Range、List、Hash、Key,其中Range比較經常使用:數據庫

RANGE分區:基於屬於一個給定連續區間的列值,把多行分配給分區。編程

LIST分區:相似於按RANGE分區,區別在於LIST分區是基於列值匹配一個離散值集合中的某個值來進行選擇。服務器

HASH分區:基於用戶定義的表達式的返回值來進行選擇的分區,該表達式使用將要插入到表中的這些行的列值進行計算。這個函數能夠包含MySQL 中有效的、產生非負整數值的任何表達式。less

KEY分區:相似於按HASH分區,區別在於KEY分區只支持計算一列或多列,且MySQL服務器提供其自身的哈希函數。必須有一列或多列包含整數值。編程語言

 


 

案例:函數

創建一個user 表 以id進行分區 id 小於10的在user_1分區id小於20的在user_2分區學習

create table user(

    id int not null auto_increment,

    username varchar(10),

    primary key(id)

)engine = innodb charset=utf8

partition by range (id)(

partition user_1 values less than (10),

partition user_2 values less than (20)

);

 

創建後添加分區:

maxvalue 表示最大值   這樣大於等於20的id 都出存儲在user_3分區

alter table user add partition(

    partition user_3 values less than maxvalue

);

 

 


 

刪除分區:

alter table user drop partition user_3;

如今打開mysql的數據目錄

能夠看見多了user#P#user_1.ibd 和user#P#user_2.ibd  這兩個文件

若是表使用的存儲引擎是MyISAM類型,就是:

user#P#user_1.MYD,user#P#user_1.MYI和user#P#user_2.MYD,user#P#user_2.MYI

分區模式詳解:

* Range(範圍) – 這種模式容許DBA將數據劃分不一樣範圍。例如DBA能夠將一個表經過年份劃分紅三個分區,80年代(1980's)的數據,90年代(1990's)的數據以及任何在2000年(包括2000年)後的數據。

CREATE TABLE users (  

       id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,  

       usersname VARCHAR(30) NOT NULL DEFAULT '',  

       email VARCHAR(30) NOT NULL DEFAULT ''  

)  

PARTITION BY RANGE (id) (  

       PARTITION p0 VALUES LESS THAN (3000000),  

       PARTITION p1 VALUES LESS THAN (6000000), 

       PARTITION p2 VALUES LESS THAN (9000000),  

       PARTITION p3 VALUES LESS THAN MAXVALUE     

);  

在這裏,將用戶表分紅4個分區,以每300萬條記錄爲界限,每一個分區都有本身獨立的數據、索引文件的存放目錄。

 


 

還能夠將這些分區所在的物理磁盤分開徹底獨立,能夠提升磁盤IO吞吐量。

若是你也想成爲程序員,想要快速掌握編程,趕忙關注小編加入學習企鵝圈子吧!

裏面有資深專業軟件開發工程師,在線解答你的全部疑惑~編程語言入門「so easy」

資料包含:編程入門、遊戲編程、課程設計等。

免費學習書籍:

 


 

免費學習資料:

 

CREATE TABLE users (  

       id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,  

       usersname VARCHAR(30) NOT NULL DEFAULT '',  

       email VARCHAR(30) NOT NULL DEFAULT ''  

)  

PARTITION BY RANGE (id) (  

       PARTITION p0 VALUES LESS THAN (3000000)  

       DATA DIRECTORY = '/data0/data'  

       INDEX DIRECTORY = '/data0/index',  

       PARTITION p1 VALUES LESS THAN (6000000)  

       DATA DIRECTORY = '/data1/data'  

       INDEX DIRECTORY = '/data1/index',  

       PARTITION p2 VALUES LESS THAN (9000000)  

       DATA DIRECTORY = '/data2/data'  

       INDEX DIRECTORY = '/data2/index',  

       PARTITION p3 VALUES LESS THAN MAXVALUE     

       DATA DIRECTORY = '/data3/data'   

       INDEX DIRECTORY = '/data3/index'  

);  

* List(預約義列表) – 這種模式容許系統經過DBA定義的列表的值所對應的行數據進行分割。例如:DBA根據用戶的類型進行分區。 

CREATE TABLE user (  

     id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,  

     name VARCHAR(30) NOT NULL DEFAULT '' ,

     user_type   int not null

)  

PARTITION BY LIST (user_type ) (  

     PARTITION p0 VALUES IN (0,4,8,12) , 

     PARTITION p1 VALUES IN (1,5,9,13) ,  

     PARTITION p2 VALUES IN (2,6,10,14),  

     PARTITION p3 VALUES IN (3,7,11,15)   

);

分紅4個區,一樣能夠將分區設置的獨立的磁盤中。

* Key(鍵值)

CREATE TABLE user (  

     id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,  

     name VARCHAR(30) NOT NULL DEFAULT '',  

     email VARCHAR(30) NOT NULL DEFAULT ''  

)  

PARTITION BY KEY (id) PARTITIONS 4 (  

     PARTITION p0,  

     PARTITION p1,  

     PARTITION p2,  

     PARTITION p3

);

* Hash(哈希)

CREATE TABLE user (  

     id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,  

     username VARCHAR(30) NOT NULL DEFAULT '',  

     email VARCHAR(30) NOT NULL DEFAULT ''  

)  

PARTITION BY HASH (id) PARTITIONS 4 (  

     PARTITION p0 ,  

     PARTITION p1,  

     PARTITION p2,

     PARTITION p3  

);

分表

分表和分區相似,區別是,分區是把一個邏輯表文件分紅幾個物理文件後進行存儲,而分表則是把原先的一個表分紅幾個表。進行分表查詢時能夠經過union或者視圖。

分表又分垂直分割和水平分割,其中水平分分割最爲經常使用。水平分割一般是指切分到另一個數據庫或表中。例如對於一個會員表,按對3的模進行分割:

table = id%3

若是id%3 = 0 則將用戶數據放入到user_0表中,如id%3=1就放入user_1表中,依次類推。

在這裏有個問題,這個uid應該是全部會員按序增加的,可他是怎麼獲得的呢?使用auto_increment是不行的,這樣就用到序列了。

對於一些流量統計系統,其數據量比較大,而且對過往數據的關注度不高,這時按年、月、日進行分表,將每日統計信息放到一個以日期命名的表中;或者按照增量進行分表,如每一個表100萬數據,超過100萬就放入第二個表。還能夠按Hash進行分表,可是按日期和取模餘數分表最爲常見,也容易擴展。

分表後可能會遇到新的問題,那就是查詢,分頁和統計。通用的方法是在程序中進行處理,輔助視圖。

相關文章
相關標籤/搜索