數據庫設計的三大範式:爲了創建冗餘較小、結構合理的數據庫,設計數據庫時必須遵循必定的規則。在關係型數據庫中這種規則就稱爲範式。範式是符合某一種設計要求的總結。要想設計一個結構合理的關係型數據庫,必須知足必定的範式。java
在實際開發中最爲常見的設計範式有三個:第一範式是最基本的範式。若是數據庫表中的全部字段值都是不可分解的原子值,就說明該數據庫表知足了第一範式;第二範式在第一範式的基礎之上更進一層。第二範式須要確保數據庫表中的每一列都和主鍵相關,而不能只與主鍵的某一部分相關(主要針對聯合主鍵而言)。也就是說在一個數據庫表中,一個表中只能保存一種數據,不能夠把多種數據保存在同一張數據庫表中;第三範式須要確保數據表中的每一列數據都和主鍵直接相關,而不能間接相關。總結一下,就是:第一範式(確保每列保持原子性);第二範式(確保表中的每列都和主鍵相關);第三範式(確保每列都和主鍵列直接相關,而不是間接相關)。mysql
在目前的企業信息系統中,數據庫仍是最佳的數據存儲方式,雖然已經有不少的書籍在指導咱們進行數據庫設計,但應該那種方式是設計數據庫的表結構的最好方法、設計時應聽從什麼樣的原則、四個範式如何可以用一種方式達到順暢的應用等是我一直在思考和總結的問題,下文是我針對這幾個問題根據本身的設計經歷準備總結的一篇文章的提綱,歡迎你們一塊進行探討,集思廣益。其中提到了領域建模的概念,但未做詳細解釋,但願之後可以有時間咱們針對這個命題進行深刻探討。sql
1.不該該針對整個系統進行數據庫設計,而應該根據系統架構中的組件劃分,針對每一個組件所處理的業務進行組件單元的數據庫設計;不一樣組件間所對應的數據庫表之間的關聯應儘量減小,若是不一樣組件間的表須要外鍵關聯也儘可能不要建立外鍵關聯,而只是記錄關聯表的一個主鍵,確保組件對應的表之間的獨立性,爲系統或表結構的重構提供可能性。數據庫
//注意他這裏說的是"不要建立外鍵關聯",建立外鍵關聯的語句是: //foreign key(member_id) references member (id); //咱們幾乎沒有用到這條語句,由於咱們就是這樣作的,用到外鍵時,只是記錄關聯表的主鍵,而非在數據庫級別上建立外鍵。 //也不知道是歪打正着,仍是前輩DBA過於強大,已經考慮好了。
2.採用領域模型驅動的方式和自頂向下的思路進行數據庫設計,首先分析系統業務,根據職責定義對象。對象要符合封裝的特性,確保與職責相關的數據項被定義在一個對象以內,這些數據項可以完整描述該職責,不會出現職責描述缺失。而且一個對象有且只有一項職責,若是一個對象要負責兩個或兩個以上的職責,應進行分拆。數組
// 領域模型驅動的方式,目前用的還不是很熟,考慮的不夠多。由於常常的數據庫中的表只是拿來作存儲用而已, //特別是小需求,要加什麼字段,找到相關表加上去就好了,不太考慮領域模型。這個在中文站老業務表裏很常見
3.根據創建的領域模型進行數據庫表的映射,此時應參考數據庫設計第二範式:一個表中的全部非關鍵字屬性都依賴於整個關鍵字。關鍵字能夠是一個屬性,也能夠是多個屬性的集合,不論那種方式,都應確保關鍵字可以保證惟一性。在肯定關鍵字時,應保證關鍵字不會參與業務且不會出現更新異常,這時,最優解決方案爲採用一個自增數值型屬性或一個隨機字符串做爲表的關鍵字。緩存
4.因爲第一點所述的領域模型驅動的方式設計數據庫表結構,領域模型中的每個對象只有一項職責,因此對象中的數據項不存在傳遞依賴,因此,這種思路的數據庫表結構設計從一開始即知足第三範式:一個表應知足第二範式,且屬性間不存在傳遞依賴。服務器
//數據庫三範式記不得的同窗去查資料溫習一下。 //我的認爲第三範式的目的是儘可能減小數據冗餘,保證相同的數據只存在一份。 //第三範式其實咱們遵照的並非很嚴格,特別是老的數據庫表中會有冗餘字段。這個要看狀況決定吧。
5.一樣,因爲對象職責的單一性以及對象之間的關係反映的是業務邏輯之間的關係,因此在領域模型中的對象存在主對象和從對象之分,從對象是從1-N或N-N的角度進一步完善主對象的業務邏輯,因此從對象及對象關係映射爲的表及表關聯關係不存在刪除和插入異常。session
//最後一句看不懂,多是"因此表及表關聯關係不該該出現刪除和插入異常。"?
6.在映射後得出的數據庫表結構中,應再根據第四範式進行進一步修改,確保不存在多值依賴。這時,應根據反向工程的思路反饋給領域模型。若是表結構中存在多值依賴,則證實領域模型中的對象具備至少兩個以上的職責,應根據第一條進行設計修正。第四範式:一個表若是知足BCNF,不該存在多值依賴。 架構
//第四範式咱們遵照的並很少吧。 //例如: //VAS_WP_CONFIG.config_name字段的值包括:adv(廣告主題)/glare(炫彩滾動主題)/theme_simple(普通主題)/theme_cartoon(動畫主題)/ theme_none(不顯示背景主題) //cate_background(類目背景)/video(公司視頻)/board_cartoon(動畫招牌)/board_simple(普通招牌)等。 //若是遵照第四範式,則須要新增一張VAS_WP_CONFIG_NAME表,存儲配置名稱枚舉值,而VAS_WP_CONFIG.config_name字段改成VAS_WP_CONFIG.config_name_id。 //這樣作更利於擴展,不會由於每一個人的理解不一致而向VAS_WP_CONFIG.config_name字段裏設置亂七八糟的值,可是這樣須要維護更多的小表,形成數據值表的數量膨脹,DBA可能會以爲管理上有更多的困難。 //咱們採用潛規則約定、java枚舉類等其它方式來進行保證。但有時候效果並非很好,常常發現舊數據庫表中枚舉字段的值五花八門,不全是約定的。
7.在通過分析後確認全部的表都知足2、3、四範式的狀況下,表和表之間的關聯儘可能採用弱關聯以便於對錶字段和表結構的調整和重構。而且,我認爲數據庫中的表是用來持久化一個對象實例在特定時間及特定條件下的狀態的,只是一個存儲介質,因此,表和表之間也不該用強關聯來表述業務(數據間的一致性),這一職責應由系統的邏輯層來保證,這種方式也確保了系統對於不正確數據(髒數據)的兼容性。固然,從整個系統的角度來講咱們仍是要盡最大努力確保系統不會產生髒數據,單從另外一個角度來講,髒數據的產生在必定程度上也是不可避免的,咱們也要保證系統對這種狀況的容錯性。這是一個折中的方案。併發
8.應針對全部表的主鍵和外鍵創建索引,有針對性的(針對一些大數據量和經常使用檢索方式)創建組合屬性的索引,提升檢索效率。雖然創建索引會消耗部分系統資源,但比較起在檢索時搜索整張表中的數據尤爲時表中的數據量較大時所帶來的性能影響,以及無索引時的排序操做所帶來的性能影響,這種方式仍然是值得提倡的。
//索引目前都是DBA根據具體的SQL來建立的,不過開發寫SQL時,也應該適當考慮一下字段的索引。
9.儘可能少採用存儲過程,目前已經有不少技術能夠替代存儲過程的功能如"對象/關係映射"等,將數據一致性的保證放在數據庫中,不管對於版本控制、開發和部署、以及數據庫的遷移都會帶來很大的影響。但不能否認,存儲過程具備性能上的優點,因此,當系統可以使用的硬件不會獲得提高而性能又是很是重要的質量屬性時,可通過平衡考慮選用存儲過程。
//目前都是杜絕使用存儲過程的,我以爲用起來比較方便,對於咱們來講,主要緣由是會給DBA帶來管理方面的麻煩, //由於時間一長,存儲過程的邏輯和使用場景,每每沒人能瞭解,容易產生更多問題
10.當處理表間的關聯約束所付出的代價(經常是使用性上的代價)超過了保證不會出現修改、刪除、更改異常所付出的代價,而且數據冗餘也不是主要的問題時,表設計能夠不符合四個範式。四個範式確保了不會出現異常,但也可能由此致使過於純潔的設計,使得表結構難於使用,因此在設計時須要進行綜合判斷,但首先確保符合四個範式,而後再進行精化修正是剛剛進入數據庫設計領域時能夠採用的最好辦法。
11.設計出的表要具備較好的使用性,主要體如今查詢時是否須要關聯多張表且還需使用複雜的SQL技巧。我感受遵照的範式越多,就越使SQL複雜,具體狀況具體分析。設計出的表要儘量減小數據冗餘,確保數據的準確性,有效的控制冗餘有助於提升數據庫的性能
所以,考慮了以上條件以後,表設計約定規則以下:
//規則1:表必需要有主鍵。 //規則2:一個字段只表示一個含義。 //規則3:老是包含兩個日期字段:gmt_create(建立日期),gmt_modified(修改日期),且這兩個字段不該該包含有額外的業務邏輯。 //規則4:MySQL中,gmt_create、gmt_modified使用DATETIME類型。 //規則5:禁止使用複雜數據類型(數組,自定義類型等)。 //規則6: MySQL中,附屬表拆分後,附屬表id與主表id保持一致。不容許在附屬表新增主鍵字段。 //規則7: MySQL中,存在過時概念的表,在其設計之初就必須有過時機制,且有明確的過時時間。過時數據必須遷移至歷史表中。 //規則8: MySQL中,再也不使用的表,必須通知DBA予以改名歸檔。 //規則9: MySQL中,線上表中如有再也不使用的字段,爲保證數據完整,禁止刪除。 //規則10: MySQL中,禁止使用OCI驅動,所有使用THI驅動。
關於MySQL的部分學習筆記總結:
1、事務跟存儲引擎
1.四種事務隔離級別:read uncommited, read commited(大多數db默認的),repeatable read(mysql默認), seriazable。
2.mysql是默認的auto commited, 也就是說每次查詢默認都是自動提交的(show variables like 'autocommited')。mysql能夠經過set transaction isolatioin level命令來設置隔離級別,例如:set session transaction isolation level read commited。
3.mysql中像innodb採用mvcc(多版本併發控制)來處理併發。mvcc只工做在read commited,repeatable read這兩種事務隔離級別上。read uncommited隔離級別不兼容mvcc是由於在該級別得下的查詢,不讀取符合當前事務版本的數據行,而是最新版本的數據行。seriazable隔離級別不兼容MVCC,由於該級別下的讀操做會對每一個返回行進行加鎖。
4.選擇存儲引擎,併發選用myisam,事務選擇innodb,myisam比innodb更容易出錯,出錯了恢復的時間也比較長。只有myisam支持全文檢索。
5.把表從一種存儲引擎轉到另外一種引擎:
// 1. alter table mytable engine=falcon; 操做費時,可能會佔用服務器的全部i/o處理能力。 // 2. create table innodb_table like myisam_table; // alter table innodb_table engine=innodb; // insert into innodb_table select * from myisam_table;
2、數據類型
1.儘量的要把field定義爲Not NULL, mysql比較難優化使用了可空列的查詢,它會使索引,索引統計更加複雜。可空列須要更多的存儲空間,還須要mysql內部進行特殊處理,當可空列被索引時,每條記錄都須要一個格外的字節。 即便要在表中存儲"沒有值"的字段,考慮使用0,特殊字段或者空字符串來代替。
2.datetime與timestamp能保存一樣的數據:精確度爲秒,可是timestamp使用的空間只有datetime的一半,還能保存時區,擁有特殊的自動更新能力。可是timestamp保存的時間範圍要比datetime要小得多。mysql能存儲的最細的時間粒度爲秒
3.mysql支持不少種別名,如bool,integer,nummeric.
4.float與double類型支持使用標準的浮點運算進行近似計算。 Decimal類型保存精確的小數,在>=mysql5.0,mysql服務器自身進行了decimal的運算,由於CPU不支持直接對它進行運算,因此慢一點。
5.mysql會把text與blob類型的列當成有實體的對象來進行保存。他們有各自的數據類型家族(tinytext,smalltext,text,mediumtext,longtext; blob相似); mysql對blob與text列排序方式和其餘類型有所不一樣,它不會按照字符串的完整長度來排序。而只是按照max_sort_length規定的若干個字節來進行排序。
6.採用enum來代替字符串類型。mysql在內部把每一個枚舉值都保存爲整數。enum在內部是按照數字進行排序的,而不是按照字符串。enum最很差的就是字符串列表是固定的,添加和刪除必須使用alter table。
7.ip地址,通常會採用varchar(15)列來保存。事實上,IP地址是個無符號的32位整數,而不是字符串。mysql提供了inet_aton()和inet_nota()函數在證書與ip地址之間進行轉換。
3、索引
1.彙集索引不只僅是一種單獨的索引類型,並且是一種存儲數據的方式。Innodb引擎的彙集索引實際上在一樣的結構中保存了B-Tree索引和數據行。當表有彙集索引時,它的數據行實際上保存在索引的葉子上。注意是存儲引擎來實現索引。
2.myisam與innodb數據佈局:myisam索引樹(不管是主鍵索引仍是非主鍵索引)葉子節點都是指向的數據行,而innodb中彙集索引,主鍵索引樹葉子節點就帶得有數據的內容,而非主鍵索引樹中葉子節點指向主鍵值,而不是數據的位置。
3.mysql有兩種產生排序結果的方式:使用文件排序,或者掃描有序的索引。目前只有myisam支持全文索引。
4.myisam表有表級鎖;myisam表不支持事務,實際上,myisam並不保證單條命令完成;myisam只緩存了mysql進程內部的索引,並保存在鍵緩存區內。OS緩存了表的數據;行被緊密的保存在一塊兒,磁盤上的數據有很小的磁盤佔用和快速的全表掃描。
5.innodb支持事務和四種事務隔離級別;在mysql5.0中,只有innodb支持外鍵;支持行級鎖與mvcc;全部的innodb表都是按照主鍵彙集的;全部索引(出開主鍵)都是按主鍵引用行;索引沒有使用前綴壓縮,所以索引可能比myisam大不少;數據轉載緩慢;阻塞auto_increment,也就是用表級鎖來產生每一個auto_increment。
4、MYSQL性能分析
1.mysql提供了一個benchmark(int 循環次數,char* 表達式); 能夠分析表達式執行所花時間。 例如:
// select BENCHMARK(10000,SHA1('aaaaaaaaaaaaaaaa'))
2.mysql有兩種查詢日誌:普通日誌和慢速日誌。
5、MYSQL高級特性
1.在mysql中,只有myisam存儲引擎支持全文索引。myisam全文索引是一種特殊的具備兩層結構的B樹。
2.存儲引擎事務在存儲引擎內部被賦予acid屬性,分佈式(XA)是一種高層次事務,它能夠歷喲內部個兩段提交的方式將acid屬性擴展到存儲引擎外部,甚至數據庫外部。階段1:通知全部提交者準備提交 階段2:通知全部參與者進行真正提交。
3.mysql 的字符集和校對規則有 4 個級別的默認設置:服務器級、數據庫級、表級和字段級。Mysql4.1 開始支持 SQL 的子查詢。
/******************************************/ /* 數據庫全名 = degopen@10.218.249.92:3318【mysql】 */ /* 表名稱 = task_new */ /******************************************/ CREATE TABLE `task_new` ( `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵', `task_name` varchar(128) NOT NULL COMMENT '任務名稱', `image` varchar(128) DEFAULT NULL COMMENT '任務圖標', `description` varchar(1024) NOT NULL COMMENT '任務描述', `content` varchar(1024) NOT NULL COMMENT '任務內容', `finished_message` varchar(128) DEFAULT NULL COMMENT '任務完成提示信息', `task_scope` int(11) NOT NULL COMMENT '任務範圍, 0-平臺任務, 1-遊戲任務', `series_task` int(11) NOT NULL DEFAULT '0' COMMENT '任務類型: 系列任務,單獨任務', `task_type` int(11) NOT NULL DEFAULT '0' COMMENT '任務類型: 固定任務, 推廣任務, 平常任務', `pre_task` varchar(128) DEFAULT NULL COMMENT '前置任務', `post_task` varchar(128) DEFAULT NULL COMMENT '後置任務', `task_status` int(11) NOT NULL COMMENT '任務狀態, 待審覈、未開始、生效中、已暫停、已完成、審覈未經過', `auto_task` tinyint(4) NOT NULL DEFAULT '1' COMMENT '是否手動任務, 0-否, 1-是', `is_required` tinyint(4) NOT NULL COMMENT '是否必須任務', `event_type` varchar(64) DEFAULT NULL COMMENT '關心的事件類型', `task_target` bigint(20) DEFAULT '0' COMMENT '任務目標', `reset_num` int(11) NOT NULL COMMENT '重置次數', `reset_cycle` int(11) NOT NULL COMMENT '重置週期', `task_interval` int(11) NOT NULL COMMENT '任務間隔', `xiaoer` bigint(20) unsigned NOT NULL COMMENT '建立人', `review_id` bigint(20) unsigned NOT NULL COMMENT '審覈人ID', `last_start_time` datetime DEFAULT NULL COMMENT '上次生效時間', `gmt_create` datetime NOT NULL COMMENT '建立時間', `gmt_modified` datetime NOT NULL COMMENT '修改時間', `start_time` datetime NOT NULL COMMENT '開始時間', `end_time` datetime NOT NULL COMMENT '結束時間', `start_condition` varchar(1024) NOT NULL COMMENT '任務觸發條件', `end_condition` varchar(1024) NOT NULL COMMENT '任務完成條件', `enable` tinyint(4) NOT NULL DEFAULT '1' COMMENT '是否可用', `rule` varchar(4096) NOT NULL COMMENT '任務規則', `priority` int(11) NOT NULL DEFAULT '1' COMMENT '任務優先級', `progress_rule` varchar(2048) NOT NULL DEFAULT '' COMMENT '進度計算規則', `order_no` int(11) DEFAULT '1' COMMENT '排序號', `classification` int(11) DEFAULT '0' COMMENT '0:默認分類\n1:玩遊戲\n2:抽獎', `level` int(11) DEFAULT '0' COMMENT '針對同一個分類,不一樣的等級', `ext1` longtext COMMENT '擴展字段1(UU中使用該字段指示按鈕跳轉)', `ext2` longtext COMMENT '擴展字段2,暫時預留', `channel` int(11) DEFAULT '0' COMMENT '任務渠道:0-uu或者1-game_box', `consecutive_day` int(11) DEFAULT '1' COMMENT '連續完成任務的天數', `activity` varchar(256) DEFAULT 'default' COMMENT '任務所屬的活動名字', `device` text COMMENT '機型', `packages` text COMMENT '應用', PRIMARY KEY (`id`), KEY `name_channel` (`task_name`,`channel`), KEY `activity` (`activity`(255)) ) ENGINE=InnoDB AUTO_INCREMENT=1194 DEFAULT CHARSET=utf8 COMMENT='任務表';