一.數據管理技術的發展程序員
1.分爲四個階段:人工管理階段、文件系統階段、數據庫階段和高級數據庫階段。數據庫
2.數據庫階段數據管理的特色:安全
1)採用數據模型表示複雜的數據結構。數據結構
2)有較高的數據獨立性。併發
3)數據庫系統爲用戶提供了方便的用戶接口。數據庫設計
4)提供四方面的數據控制功能:數據庫的恢復、數據庫的併發控制、數據的完整性、數據安全性。ide
5)增長了系統的靈活性函數
3.數據庫(DB):是長期存儲在計算機內、有組織的、統一管理的相關數據的集合。操作系統
4.數據庫管理系統(DBMS):是位於用戶與操做系統直接的一層數據管理軟件它爲設計
用戶或應用程序提供訪問DB的方法,包括DB的創建、查詢、更新及各類數據控制。
5.數據庫系統(DBS):是實現有組織地、動態地存儲大量關聯數據、方便多用戶訪問的計算機硬件、
軟件和數據資源組成的系統,即它是採用數據庫技術的計算機系統。
2、數據描述
1.分爲三個階段:概念設計、邏輯設計和物理設計。
2.概念設計中的術語:
1)實體:客觀存在,能夠相互區別的事物稱爲實體。
2)實體集:性質相同的同類實體的集合。
3)屬性:實體有不少特性,每個特性稱爲屬性。
4)實體標識符(關鍵碼或鍵):能惟一標識實體的屬性或屬性集。
3.邏輯設計中的術語:
1)字段(數據項):標記實體屬性的命名單位稱爲字段或數據項。
2)記錄:字段的有序集合。
3)文件:同一類記錄的集合。
4)關鍵碼:能惟一標識文件中每一個記錄的字段或字段集。
4.實體之間聯繫的元數:與一個聯繫有關的實體集個數。經常使用二元聯繫。二元聯繫的
類型有三種:一對1、一對多、多對多。
三.數據抽象的級別
1.數據模型:描述數據庫的結構和定義,對現實時間的數據進行抽象。
2.從現實世界的信息到數據庫存儲的數據以及用戶使用的數據是一個逐步抽象過程,
根據數據抽象的級別定義了四種模型:概念模型、邏輯模型、外部模型和內部模型。
3.概念模型:表達用戶需求觀點的數據全局邏輯結構的模型。
4.邏輯模型:表達計算機實現觀點的DB全局邏輯結構的模型。
5.外部模型:表達用戶使用觀點的DB局部邏輯結構的模型。
6.內部模型:表達DB物理結構的模型。
7.數據抽象的過程、即數據庫設計的過程具體步驟:
1)根據用戶需求,設計數據庫的概念模型;
2)根據轉換規則,把概念模型轉換成數據庫的邏輯模型;
3)根據用戶的業務特色,設計不一樣的外部模型,給程序員使用;
4)數據庫實現時,要根據邏輯模型設計其內部模型。
8.經常使用的概念模型是實體聯繫(ER)模型,ER模型主要用ER圖來表示。
9.邏輯模型的分類:層次模型、網狀模型、關係模型等。
10.層次模型:用樹型(層次)結構表示實體及實體間聯繫的數據模型。
11.1969年,美國IBM公司的IMS系統是典型的層次模型系統。
12.網狀模型:用有向圖結構表示實體及實體間聯繫的數據模型。
13.1969年,CODASYL組織提出DBTG報告中的數據模型是網狀模型的主要表明
14.關係模型:是由若干個關係模式組成的集合。關係模式即記錄類型,它的實例
稱爲關係,每一個關係其實是一張二維表格。
15.1970年,美國IBM公司的EFCodd連續發表論文,提出關係模型,奠基了關係數據庫的
理論基礎。關係數據庫是目前的主流數據庫。
16.外部模型中的模式稱爲視圖。
17.三級模式:
從用戶(或應用程序)到數據庫之間,DB的數據結構描述有三個層次:
1)外模式:用戶與數據庫系統的接口,是用戶用到的那部分數據的描述。
外模式由若干個記錄類型組成。
2)邏輯模式:是數據庫中所有數據的總體邏輯結構的描述。
3)內模式:是數據庫在物理存儲方面的描述。
注意:外模式是邏輯模式的子集。
18.兩級映像:
1)外模式/邏輯模式映像:存在於外模式和邏輯模式之間,用於定義外模式和邏輯
模式之間的對應性。
2)邏輯模式/內模式映像:存在於邏輯模式和內模式之間,用於定義邏輯模式和內
模式之間的對應性。
19.數據庫系統的三級模式、兩級映像結構使數據庫系統達到了高度的數據獨立性。
20.數據獨立性:是指應用程序與數據庫的數據結構之間相互獨立,在修改數據結構時,
儘量不修改應用程序。分爲邏輯數據獨立性和物理數據獨立性。
21.邏輯數據獨立性:若是數據庫的邏輯模式要修改,那麼只要對外模式/邏輯模式
映像做對應的修改,可使外模式和應用程序儘量保持不變。這樣就認爲數據庫達到了
邏輯數據獨立性。
22.物理數據獨立性:若是數據庫的內模式要修改,即數據庫的物理結構有所變化,那麼
只要對邏輯模式/內模式映像做相應的修改,可使邏輯模式儘量保持不變。
也就是對內模式的修改儘可能不影響邏輯模式,固然對外模式和應用程序的影響更小,這樣就認爲
數據庫達到了物理數據獨立性。
第三章 關係模式設計理論
1、關係模式的設計準則
一、數據冗餘:同一個數據在系統中屢次重複出現。
二、關係模式設計不當引發的異常問題:數據冗餘、操做異常(包括修改、插入和刪除異常)
三、關係模式的非形式設計準則
1)關係模式的設計應儘量只包含有直接聯想的屬性,不要包含有間接聯繫的屬性。
也就是,每一個關係模式應只對應於一個實體類型或一個聯繫類型。
2)關係模式的設計應儘量使得相應關係中不出現插入、刪除和修改等操做異常現象。
3)關係模式的設計應儘量使得相應關係中避免放置常常爲空值的屬性。
4)關係模式的設計應儘量使得關係的等值鏈接在主鍵和外鍵的屬性上進行,而且保證之後
不會生成額外的元組。
四、習慣使用的一些符號:
1)英文字母表首部的大寫字母「A,B,C...「表示單個的屬性。
2)英文字母表尾部的大寫字母「...,U,V,W,X,Y,Z「表示屬性集。
3)大寫字母R表示關係模式,小寫字母r表示其關係。
4)關係模式的簡化表示方法:R(A,B,C...)或R(ABC...)
5)屬性集X和Y的並集簡寫爲XY。
2、函數依賴
一、函數依賴(FD)的定義:設有關係模式R(U),X和Y 是屬性集U的子集,
函數依賴是造成X-->Y的一個命題,只要r是R的當前關係,對r中任意兩個元組
t和s,都有t[X]=s[X]蘊涵t[Y]=s[Y],那麼稱FD X-->Y在關係模式R(U)中成立。
說明:1)