小溫談數據庫優化--數據設計篇(轉載)

三大範式:html

  第1規範:沒有重複的組或多值的列,這是數據庫設計的最低要求。數據庫

  第2規範: 每一個非關鍵字段必須依賴於主關鍵字,不能依賴於一個組合式主關鍵字的某些組成部分。消除部分依賴,大部分狀況下,數據庫設計都應該達到第二範式。編程

  第3規範: 一個非關鍵字段不能依賴於另外一個非關鍵字段。消除傳遞依賴,達到第三範式應該是系統中大部分表的要求,除非一些特殊做用的表。緩存

  更高的範式要求這裏就再也不做介紹了,我的認爲,若是所有達到第二範式,大部分達到第三範式,系統會產生較少的列和較多的表,於是減小了數據冗餘,也利於性能的提升。服務器

  徹底按照三大範式規範化設計的系統幾乎是不可能的,除非系統特別的小,在規範化設計後,有計劃地加入冗餘是必要的。冗餘能夠是冗餘數據庫、冗餘表或者冗餘字段,不一樣粒度的冗餘能夠起到不一樣的做用。冗餘能夠是爲了編程方便而增長,也能夠是爲了性能的提升而增長。從性能角度來講,冗餘數據庫能夠分散數據庫壓力,冗餘表能夠分散數據量大的表的併發壓力,也能夠加快特殊查詢的速度,冗餘字段能夠有效減小數據庫表的鏈接,提升效率。併發

  主鍵的設計數據庫設計

  主鍵是必要的,SQL SERVER的主鍵同時是一個惟一索引,並且在實際應用中,咱們每每選擇最小的鍵組合做爲主鍵,因此主鍵每每適合做爲表的彙集索引。彙集索引對查詢的影響是比較大的,這個在下面索引的敘述。分佈式

  在有多個鍵的表,主鍵的選擇也比較重要,通常選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可使主鍵的B樹結構的層次更少。性能

  主鍵的選擇還要注意組合主鍵的字段次序,對於組合主鍵來講,不一樣的字段次序的主鍵的性能差異可能會很大,通常應該選擇重複率低、單獨或者組合查詢可能性大的字段放在前面。設計

  外鍵的設計

  外鍵做爲數據庫對象,不少人認爲麻煩而不用,實際上,外鍵在大部分狀況下是頗有用的,理由是:

  外鍵是最高效的一致性維護方法,數據庫的一致性要求,依次能夠用外鍵、CHECK約束、規則約束、觸發器、客戶端程序,通常認爲,離數據越近的方法效率越高。

  謹慎使用級聯刪除和級聯更新,級聯刪除和級聯更新做爲SQL SERVER 2000當年的新功能,在2005做了保留,應該有其可用之處。我這裏說的謹慎,是由於級聯刪除和級聯更新有些突破了傳統的關於外鍵的定義,功能有點太過強大,使用前必須肯定本身已經把握好其功能範圍,不然,級聯刪除和級聯更新可能讓你的數據莫名其妙的被修改或者丟失。從性能看級聯刪除和級聯更新是比其餘方法更高效的方法。

  字段數據類型設計原則:

  A、數據類型儘可能用數字型,數字型的比較比字符型的快不少,尤爲是做爲主鍵。

  B、 數據類型儘可能小,這裏的儘可能小是指在知足能夠預見的將來需求的前提下的,節省一個字節是一個字節,雖然硬盤便宜也不能浪費啊。

  C、 儘可能不要容許NULL,除非必要,能夠用NOT NULL+DEFAULT代替。

  爲何最好不要爲null呢,由於在程序處理過程當中,你常常要爲null值進行處理,好比使用isnull進行判斷,這樣削弱查詢的速度,還有程序中須要不斷的爲null值進行判斷,多寫了代碼,減小了程序的性能。

  D、少用TEXT和IMAGE,二進制字段的讀寫是比較慢的,並且,讀取的方法也很少,大部分狀況下最好不用。在SQL Server 2005儘量使用nvarchar(max), 或者varchar(max); 除非必要圖片儘可能上傳到服務器,數據庫保留上傳地址。

  E、自增字段要慎用

  1. 不利於數據遷移;

  2. 不利於分佈式部署;

  3. 沒法預知Id,爲子表數據插入形成困難;

  4. 沒有實際意義,沒法讓人看出這個數字到底有什麼用。

  F、儘量使用定長數據類型,而不是變長數據類型。

  爲何不要設計過多的變長類型的數據呢?

  1. 對於 SQl Server 爲說,變長類型的數據,在更新的時候,若是長度比之前的大,會進行頁拆分。會對查詢性能形成嚴重的影響。會增長查詢時,I/O 的花費 (Cost) 頁分隔越多,查詢時,I/O 的開銷就越大。對於變長的字段來講,有可能這個字符的內容存儲在不一樣的位置,這個字段的內容存儲在不一樣的位置。存儲在不一樣的頁中, 它們之間有指針來關聯。這種狀況會形成查詢時,磁頭來回尋址,定位。可能你查一條記錄,磁頭找這條記錄的這個變長字段的內容,都要去好幾個頁裏找,才能完整的找到。這樣,就形成了很大個 I/O 開銷,下降了查詢性能。從物理上來講,文件原本就常常容易產生碎片。再加上變長類型的頁拆分。

  頁是SQL Server存儲數據的基本單位,大小爲8kb,能夠存儲表數據、索引數據、執行計劃數據、分配位圖、可用空間信息。頁是SQL  Server能夠讀寫的最小I/O單位。即使是讀取一行數據,它也要把整個頁加載到緩存並從緩存中讀取數據。

  頁拆分是這樣產生的:

  好比:有一個變長類型的字段 Content: nvarchar(512)。你添加一條記錄,給 Content 的值是 N'ABC',那麼,存儲的時候,直接就存儲 N'ABC' 了。當你下次 Update 這條記錄的 Content 字段時,給的值是 N'ABCDEF',那麼就會發生頁拆分。DEF 對被存儲在其它頁。由於有可能上一次分配的數據頁已經存儲了其餘行的數據對吧,對,512,只是用來限制這個字段的長度。並不與頁拆分有關係。記錄的物理順序,與你 INSERT 的順序是一致。你 INSERT 了 N條,而後再去修改第一條,這時候可能不在同一個頁了。

  以上結論就是把變長字段的內容加大,就會形成頁拆分了。也就是說可變長類型是把一頁填滿,再填另外一頁,影響比較大的是,每次insert的時候會增長分配數據頁的次數。

  固然有可能形成一行數據保存在2個數據頁裏。可是,一樣,不但頁拆分對增長查詢時的 I/O 開銷,字符沒必要要的太長,也會增長 I/O 開銷。

  2. 字段大小對錶總大小有影響

  SQL Server 2005單行字段總長是8060字節。

  3. 可變長類型是有長度限制的

  以上內容是第一篇,請你們多多發表意見!

相關文章
相關標籤/搜索