/*文章整理自網絡*/html
原文:程序員
1.http://www.cnblogs.com/longmsdu/articles/5292787.html算法
2.http://blog.csdn.net/lovegod12/archive/2009/03/13/3986346.aspx數據庫
3.http://blog.csdn.net/dreamcode/article/details/8557197安全
4.http://blog.csdn.net/xiadaoceshen/article/details/8559053網絡
基本建表規範:
1.自增主鍵通常都須要設置(`id` int unsigned NOT NULL AUTO_INCREMENT); 2.不定長字符串長度使用varchar類型,須要考慮實際業務最長長度的基礎上擴容20%到40%爲宜,且長度取2的指數長爲宜(64,128,256等); 3.定長長度使用char類型,長度直接取實際長度便可,相似於手機號字段; 4.全部字段除了軟刪除字段(delete_time),都須要設置爲not null,而且設置默認值(字符串默認值爲'',整型默認值爲0); 5.基本全部的字段,表名都加上備註,除了自增主鍵,建立時間,更新時間之類的通用字段。 6.表結構需指定存儲引擎,默認字符集。 7.關於索引的建立,建議只建立其它表在這個的表的外鍵和查詢頻繁的字段。其它字段在業務擴展時我會及時跟進並設定。 8.表名和字段名以英文加下劃線隔分,字段中英文單詞以不超過三個單詞爲宜。 9.狀態字段設置爲tinyint,同時備註寫清楚不一樣數字表明的類型。
範式標準:
基本表及其字段之間的關係, 應儘可能知足第三範式。可是,知足第三範式的數據庫設計,每每不是最好的設計。
爲了提升數據庫的運行效率,經常須要下降範式標準:適當增長冗餘,達到以空間換時間的目的。
冗餘:
主鍵與外鍵在多表中的重複出現,不屬於數據冗餘,這個概念必須清楚,事實上有許多人還不清楚。
非鍵字段的重複出現, 纔是數據冗餘!並且是一種低級冗餘,即重複性的冗餘。高級冗餘不是字段的重複出現,而是字段的派生出現。
視圖:
對於某些與國家政治、經濟、技術、軍事和安全利益有關的信息系統,視圖的做用更加劇要。這些系統的基本表完成物理設計以後,
當即在基本表上創建第一層視圖,這層視圖的個數和結構,與基本表的個數和結構是徹底相同。而且規定,全部的程序員,一概只准在視圖上操做。
(問題:能夠直接對視圖進行update,delete操做嗎? 答:某些狀況能夠,有些狀況不能夠,例如join
建視圖:create view a as select * from b)
只有數據庫管理員,帶着多我的員共同掌握的「安全鑰匙」,才能直接在基本表上操做。
防止數據庫設計打補丁的方法是「三少原則」
(1) 一個數據庫中表的個數越少越好。只有表的個數少了,才能說明系統的E--R圖少而精,去掉了重複的多餘的實體,造成了對客觀世界的高度抽象,進行了系統的數據集成,防止了打補丁式的設計;數據結構
(2) 一個表中組合主鍵的字段個數越少越好。由於主鍵的做用,一是建主鍵索引,二是作爲子表的外鍵,因此組合主鍵的字段個數少了,不只節省了運行時間,並且節省了索引存儲空間;數據庫設計
(3) 一個表中的字段個數越少越好。只有字段的個數少了,才能說明在系統中不存在數據重複,且不多有數據冗餘,更重要的是督促讀者學會「列變行」,這樣就防止了將子表中的字段拉入到主表中去,優化
在主表中留下許多空餘的字段。所謂「列變行」,就是將主表中的一部份內容拉出去,另外單獨建一個子表。這個方法很簡單,有的人就是不習慣、不採納、不執行。spa
數據庫設計的實用原則是:在數據冗餘和處理速度之間找到合適的平衡點。「三少」是一個總體概念,綜合觀點,不能孤立某一個原則。該原則是相對的,不是絕對的。「三多」原則確定是錯誤的。
試想:若覆蓋系統一樣的功能,一百個實體(共一千個屬性) 的E--R圖,確定比二百個實體(共二千個屬性) 的E--R圖,要好得多。
提倡「三少」原則,是叫讀者學會利用數據庫設計技術進行系統的數據集成。數據集成的步驟是將文件系統集成爲應用數據庫,將應用數據庫集成爲主題數據庫,將主題數據庫集成爲全局綜合數據庫。
集成的程度越高,數據共享性就越強,信息孤島現象就越少,整個企業信息系統的全局E—R圖中實體的個數、主鍵的個數、屬性的個數就會越少。
提倡「三少」原則的目的,是防止讀者利用打補丁技術,不斷地對數據庫進行增刪改,使企業數據庫變成了隨意設計數據庫表的「垃圾堆」,或數據庫表的「大雜院」,
最後形成數據庫中的基本表、代碼表、中間表、臨時表雜亂無章,不可勝數,致使企事業單位的信息系統沒法維護而癱瘓。
「三多」原則任何人均可以作到,該原則是「打補丁方法」設計數據庫的歪理學說。「三少」原則是少而精的原則,它要求有較高的數據庫設計技巧與藝術,不是任何人都能作到的,由於該原則是杜絕用「打補丁方法」設計數據庫的理論依據
提升數據庫運行效率的辦法
在給定的系統硬件和系統軟件條件下,提升數據庫系統的運行效率的辦法是:
(1) 在數據庫物理設計時,下降範式,增長冗餘, 少用觸發器, 多用存儲過程。
(2) 當計算很是複雜、並且記錄條數很是巨大時(例如一千萬條),複雜計算要先在數據庫外面,以文件系統方式用C++語言計算處理完成以後,最後才入庫追加到表中去。這是電信計費系統設計的經驗。
(3) 發現某個表的記錄太多,例如超過一千萬條,則要對該表進行水平分割。水平分割的作法是,以該表主鍵PK的某個值爲界線,將該表的記錄水平分割爲兩個表。
若發現某個表的字段太多,例如超過八十個,則垂直分割該表,將原來的一個表分解爲兩個表。
(4) 對數據庫管理系統DBMS進行系統優化,即優化各類系統參數,如緩衝區個數。
(5) 在使用面向數據的SQL語言進行程序設計時,儘可能採起優化算法。
總之,要提升數據庫的運行效率,必須從數據庫系統級優化、數據庫設計級優化、程序實現級優化,這三個層次上同時下功夫。