公共基礎知識資料程序員
第一章 算法
數據結構與算法 數據庫
【考點1】算法的基本概念 編程
算法:是指一組有窮的指令集,是解題方案的準確而完整的描述。算法不等於程序,也不等於計算方法。 數組
算法的基本特徵: 安全
肯定性,算法中每一步驟都必須有明肯定義,不容許有多義性; 數據結構
有窮性,算法必須能在有限的時間內作完,即能在執行有限個步驟後終止; 可行性,算法原則上可以精確地執行; 擁有足夠的情報。 併發
算法的組成要素:一個算法由數據對象的運算和操做以及其控制結構這兩部分組成。 框架
算法的基本運算和操做:算術運算,邏輯運算,關係運算,數據傳輸。數據庫設計
算法的基本控制結構:順序,選擇,循環。
算法基本設計方法:列舉法、概括法、遞推、遞歸、減半遞推技術。
【考點2】算法的複雜度
算法效率的度量——算法的複雜度:時間複雜度和空間複雜度。
算法時間複雜度:指執行算法所須要的計算工做量。一般,一個算法所用的時間包括編譯時間和運行時間。
算法空間複雜度:指執行這個算法所須要的內存空間。包括算法程序所佔的空間,輸入的初始數據所佔的空間,算法執行過程當中所需的額外空間。
空間複雜度和時間複雜度並不相關。
【考點3】數據結構的基本概念
數據:數據是客觀事物的符號表示,是能輸入到計算機中並被計算程序識別和處理的符號的總稱,如文檔,聲音,視頻等。
數據元素:數據元素是數據的基本單位。
數據對象:數據對象是性質相同的數據元素的集合。
數據結構:是指由某一數據對象中全部數據成員之間的關係組成的集合。
【考點4】邏輯結構和存儲結構
數據結構可分爲數據的邏輯結構和存儲結構。
數據的邏輯結構是對數據元素之間的邏輯關係的描述,與數據的存儲無關,是面向問題的,是獨立於計算機的。它包括數據對象和數據對象之間的關係。
數據的存儲結構也稱爲數據的物理結構,是數據在計算機中的存放的方式,是面向計算機的,它包括數據元素的存儲方式和關係的存儲方式。
線性表中各數據元素在存儲空間中是按邏輯順序依次存放的。
元素ai的存儲地址爲:ADR(ai)=ADR(a1)+(i-1)*k,ADR(a1)爲第一個元素的地址,k表明每一個元素佔的字節數。
順序表的運算:查找、插入、刪除。
【考點7】線性鏈表
線性鏈表是線性表的鏈式存儲結構,數據結構中的每個結點對應於一個存儲單元,這種存儲單元稱爲存儲結點,簡稱結點。
結點由兩部分組成:
(1) 用於存儲數據元素值,稱爲數據域;
(2) 用於存放指針,稱爲指針域,用於指向前一個或後一個結點。
在鏈式存儲結構中,存儲數據結構的存儲空間能夠不連續,各數據結點的存儲順序與數據元素之間的邏輯關係能夠不一致,而數據元素之間的邏輯關係是由指針域來肯定的。
鏈式存儲方式既可用於表示線性結構,也可用於表示非線性結構。
線性單鏈表中,HEAD稱爲頭指針,HEAD=NULL(或0)稱爲空表。
雙向鏈表有兩個指針:左指針(Llink)指向前件結點,右指針(Rlink)指向後件結點。
循環鏈表:循環鏈表與單鏈表的不一樣的是它的最後一個結點的指針域存放的事指向第一個結點的指針而單鏈表存放的是空指針。
線性鏈表的基本運算:查找、插入、刪除。
【考點8】棧
一、棧的基本概念
棧是一種特殊的線性表,只容許在表的一端進行插入和刪除的線性表;插入,刪除的一端爲棧頂,另外一端爲棧底;當表中沒有元素時爲空棧。
棧是一種後進先出(或先進後出Last In First Out)的線性表。
棧具備記憶功能。
棧的實例:火車調度,子彈夾。
二、棧的存儲結構
順序存儲結構:用一組地址連續的存儲單元即一維數組來存儲;
鏈式存儲:用線性鏈表來存儲;
三、棧的基本運算
(1) 入棧運算,在棧頂位置插入元素;
(2) 退棧運算,刪除元素(取出棧頂元素並賦給一個指定的變量);
(3) 讀棧頂元素,將棧頂元素賦給一個指定的變量,此時指針無變化。
【考點9】隊列
1.隊列的基本概念
隊列是一種特殊的線性表,只容許在表的一端插入,在另外一端刪除,容許插入的一端是隊尾(rear),容許刪除的一端爲隊頭(front);當表中沒有元素是空隊列;隊列是一種先進先出的線性表。 (FIFO)
二、隊列的存儲結構
順序存儲:一維數組。
鏈式存儲:線性鏈表。
三、隊列的運算:
(1) 入隊運算:從隊尾插入一個元素;
(2) 退隊運算:從隊頭刪除一個元素。
隊列的順序存儲結構通常採用循環隊列的形式。循環隊列s=0表示隊列爲空;s=1且front=rear表示隊滿。
計算循環隊列的元素個數:「尾指針減頭指針」,若爲負數,再加其容量便可。
【考點10】樹的基本概念
樹是一種非線性結構,是n個結點的有限集。當n=0 時爲空樹,n>0時爲非空樹。
【考點11】二叉樹及其基本性質
一、二叉樹的概念
二叉樹是一種特殊的樹形結構,每一個結點最多隻有兩棵子樹,且有左右之分不能互換。二叉樹有五種不一樣的形態。
二、二叉樹的性質
性質1 在二叉樹的第k層上,最多有2k-1(k≥1)個結點。
性質2 深度爲m的二叉樹最多有2m-1個結點。
性質3 在任意一棵二叉樹中,度爲0的結點(葉子結點)老是比度爲2的結點多一個。
性質4 具備n個結點的二叉樹,其深度不小於 [log2n]+1,其中[log2n]表示爲log2n的整數部分。
三、二叉樹的存儲結構需瞭解。
【考點12】滿二叉樹與徹底二叉樹
滿二叉樹:除最後一層外,每一層上的全部結點都有兩個子結點。在滿二叉樹中,每一層上的結點數都達到最大值,即在滿二叉樹的第k層上有2k-1個結點,且深度爲m的滿二叉樹有2m-1個結點。
徹底二叉樹是指這樣的二叉樹:除最後一層外,每一層上的結點數均達到最大值;在最後一層上只缺乏右邊的若干結點。
滿二叉樹是徹底二叉樹,而徹底二叉樹通常不是滿二叉樹。
【考點13】徹底二叉樹的性質
性質1具備n個結點的徹底二叉樹的深度爲[log2n]+1。
性質2 徹底二叉樹中度爲1的結點數爲0或1。
【考點14】二叉樹的遍歷
前序遍歷:先訪問根結點、而後遍歷左子樹,最後遍歷右子樹;而且,在遍歷左、右子樹時,仍然先訪問根結點,而後遍歷左子樹,最後遍歷右子樹。
中序遍歷:先遍歷左子樹、而後訪問根結點,最後遍歷右子樹;而且,在遍歷左、右子樹時,仍然先遍歷左子樹,而後訪問根結點,最後遍歷右子樹。
後序遍歷:先遍歷左子樹、而後遍歷右子樹,最後訪問根結點;而且,在遍歷左、右子樹時,仍然先遍歷左子樹,而後遍歷右子樹,最後訪問根結點。
【考點15】順序查找
順序查找是從表的一端開始,依次掃描表中的各個元素,並與所要查找的數進行比較。
在下列兩種狀況下也只能採用順序查找:
(1)若是線性表爲無序表,則無論是順序存儲結構仍是鏈式存儲結構,只能用順序查找。
(2)即便是有序線性表,若是採用鏈式存儲結構,也只能用順序查找。
【考點16】二分查找
二分查找的條件:
(1)用順序存儲結構 ;
(2)線性表是有序表。 查找的步驟也可能會考。
對於長度爲n的有序線性表,在最壞狀況下,二分法查找只需比較log2n次,而順序查找須要比較n次。
【考點17】排序
一、交換排序
二、插入類排序法:
(1)簡單插入排序法,最壞狀況須要n(n-1)/2次比較;
(2)希爾排序法,最壞狀況須要O(n1.5)次比較。(大寫O是算法複雜度的表示方法)
三、選擇類排序法:
(1)簡單選擇排序法,最壞狀況須要n(n-1)/2次比較;
(2)堆排序法,最壞狀況須要O(nlog2n)次比較。
相比以上幾種(除希爾排序法外),堆排序法的時間複雜度最小。
程序設計基礎
【考點1】程序設計方法與風格
造成良好的程序設計風格需注意:
二、數聽說明的方法;
三、語句的結構;
四、輸入和輸出。
註釋分序言性註釋和功能性註釋。 語句結構清晰第1、效率第二。
【考點2】結構化程序設計方法的四條原則
自頂向下,逐步求精,模塊化,限制使用goto語句。
屬性:即對象所包含的信息,它在設計對象時肯定,通常只能經過執行對象的操做來改變。
類:是具備類似屬性與操做的一組對象。類是關於對象性質的描述。類是對象的抽象,對象是其對應類的一個實例。
【考點7】消息及其組成
消息:是一個實例與另外一個實例之間傳遞的信息。對象間的通訊靠消息傳遞。它請求對象執行某一處理或回答某一要求的信息,它統一了數據流和控制流。
消息的組成包括:
【考點8】繼承和多態
繼承:是使用已有的類定義做爲基礎創建新類的定義技術,廣義指可以直接得到已有的性質和特徵,而沒必要重複定義他們。
繼承具備傳遞性,一個類實際上繼承了它上層的所有基類的特性。
繼承分單繼承和多重繼承。單繼承指一個類只容許有一個父類,即類等級爲樹形結構;多重繼承指一個類容許有多個父類。
多態性:是指一樣的消息被不一樣的對象接受時可致使徹底不一樣的行動的現象。
軟件工程基礎
【考點1】軟件定義與軟件特色
軟件指的是計算機系統中與硬件相互依存的另外一部分,包括程序、數據和相關文檔的完整集合。
程序:軟件開發人員根據用戶需求開發的、用程序設計語言描述的、適合計算機執行的指令序列。
數據:使程序能正常操縱信息的數據結構;
文檔:與程序的開發、維護和使用有關的圖文資料;
軟件的特色:
根據應用目標的不一樣,軟件可分應用軟件、系統軟件和支撐軟件(或工具軟件)。
【考點2】軟件的生命週期
軟件生命週期是指軟件產品從提出、實現、使用維護到中止使用退役的整個過程。可分爲軟件定義,軟件開發及軟件維護3個階段。軟件生命週期中,可以準確肯定軟件系統必須作什麼和必須具有哪些功能的階段是:需求分析。
【考點3】軟件危機和軟件工程的概念
軟件危機泛指在計算機軟件的開發和維護過程當中遇到的一系列嚴重的問題,集中表如今成本,質量,生產效率等幾個方面。
所謂軟件工程是指採用工程的概念、原理、技術和方法指導軟件的開發與維護。是創建並使用完善的工程化原則,以較經濟的手段得到,能在實際機器上有效運行的可靠軟件的一系列方法;
軟件工程的主要思想強調在軟件開發過程當中須要應用工程化原則。軟件工程的核心思想是把軟件看成一個工程產品來處理。
軟件工程包括3個要素:方法,工具和過程 方法:方法是完成軟件工程項目的技術手段 工具:工具支持軟件的開發、管理、文檔生成 過程:過程支持軟件開發的各個環節的控制、管理。
【考點4】軟件工程過程
軟件工程過程是把軟件轉化爲輸出的一組彼此相關的資源活動,包含4種基本活動:
(4)A(action)——軟件演進。
【考點5】軟件開發技術和軟件工程管理
【考點6】軟件工程的原則
軟件工程的原則:抽象,信息隱蔽,模塊化,局部化,肯定性,一致性,完備性,可驗證性。
【考點7】需求分析概述
需求分析階段的工做:需求獲取,需求分析,編寫需求規格說明書,需求評審。 需求分析方法有:
(1)結構化需求分析方法:
① 面向數據結構的Jackson方法(ISD);
②面向數據流的結構化分析方法(SA);
③面向數據結構的結構化數據系統開發方法(DSSD);
(2)面向對象的分析的方法(OOA):
從需求分析創建的模型的特性來分:靜態分析和動態分析。
【考點8】結構化方法和結構化分析方法
結構化方法包括結構化分析方法,結構化設計方法,結構化編程方法。結構處理中具備多個判斷,並且每一個決策與若干條件有關。
斷定表:與斷定樹相似,也是一種描述加工的圖形工具。若是一個加工邏輯有多個條件、多個操做,而且在不一樣的條件組合下執行不一樣的操做,那麼可使用斷定表來描述。
【考點9】軟件需求規格說明書
軟件需求規格說明書(SRS,Software Requirement Specification)是需求分析階段得出的最主要的文檔。軟件需求規格說明書的特色:有正確性、無歧義性、完整性、可驗證性、一致性、可理解性、可修改性和可追蹤性。其中最重要的是無歧義性。
【考點10】軟件設計的基本概念
軟件設計是肯定系統的物理模型。 軟件設計是開發階段最重要的步驟,是將需求準確地轉化爲完整的軟件產品或系統的惟一途徑。
從技術觀點上看,軟件設計包括軟件結構設計、數據設計、接口設計、過程設計。
(1)結構設計定義軟件系統各主要部件之間的關係;
(2)數據設計將分析時建立的模型轉化爲數據結構的定義;
(3)接口設計是描述軟件內部、軟件和協做系統之間以及軟件與人之間如何通訊;
(4)過程設計則是把系統結構部件轉換爲軟件的過程性描述。
從工程管理角度來看,軟件設計分兩步完成:概要設計和詳細設計。
(1)概要設計將軟件需求轉化爲軟件體系結構、肯定系統級接口、全局數據結構或數據庫模式;
(2)詳細設計確立每一個模塊的實現算法和局部數據結構,用適當方法表示算法和數據結構的細節。
【考點11】軟件設計的基本原理
軟件設計中應該遵循的基本原理和與軟件設計有關的概念:
【考點12】耦合性和內聚性
衡量軟件的模塊獨立性是用耦合性和內聚性兩個定性的度量標準。
耦合性:是對一個軟件結構內不一樣模塊之間互聯程度的度量。耦合性的強弱取決於模塊間接口的複雜程度。
內聚性:是一個模塊內部各個元素間彼此結合的緊密程度的度量。 一個模塊的內聚性越強則該模塊的模塊獨立性越強。一個模塊與其餘模塊的耦合性越強則該模塊的模塊獨立性越弱。
在結構程序設計中,模塊劃分的原則是模塊內具備高內聚度,模塊間具備低耦合度。
耦合和內聚的種類。
耦合度由低到高:非直接耦合,數據耦合,標記耦合,控制耦合,外部耦合,公共耦合,內容耦合。
內聚性由強到弱:功能內聚,順序內聚,通訊內聚,過程內聚,時間內聚,邏輯內聚,偶然內聚。
【考點13】結構化設計方法
結構化分析方法是面向數據流自頂而下,逐步求精進行需求分析的方法,基本思想將軟件設計成由相對獨立,單一功能的模塊組成的結構,與結構分析方法銜接使用,以數據流圖爲基礎獲得軟件的模塊結構,適用於變換型結構和事物型結構的目標系統。
一、概要設計的任務:
(1)劃分出組成系統的物理元素
(2)設計軟件的結構
二、概要設計的工具: 結構圖(SC-Structure Chart)也稱程序結構圖,在結構圖中,模塊用一個矩形表示,箭頭表示模塊間的調用關係。能夠用帶註釋的箭頭表示模塊調用過程當中來回傳遞的信息。還可用帶實心圓的箭頭表示傳遞的是控制信息,空心圓箭心表示傳遞的是數據。
結構圖的基本形式:基本形式、順序形式、重複形式、選擇形式。
結構圖有四種模塊類型:傳入模塊、傳出模塊、變換模塊和協調模塊。
程序結構圖中的專業術語:
深度:表示控制的層數 ;
上級模塊,從屬模塊:上,下兩層模塊a和b,且有a調用b,則a是上級模塊,b是從屬模塊 ;
寬度:總體控制跨度(最大模塊的層)的表示 扇入:調用該模塊的模塊個數 ;
扇出:一個模塊直接調用的其餘模塊數 原子模塊:樹中位於葉子節點的模塊。
三、面向數據流的設計方法
任何軟件系統均可以用數據流圖表示,典型的數據流類型有兩種:變換型和事務型。
變換型系統結構圖由輸入、中心變換、輸出三部分組成。
四、設計的準則
(4)使模塊的做用域在該模塊的控制域內。
(5)減小模塊的接口和界面的複雜性。
(6)設計成單入口,單出口的模塊。
(7)設計功能可預測的模塊。
詳細設計經常使用的設計工具(工程設計工具):圖形工具,表格工具和語言工具。
圖形工具:
程序流程圖:箭頭表示控制流,方框表示加工步驟,菱形表示邏輯條件。
N-S圖:有五種基本圖形。
PAD圖:問題分析圖,有五種基本圖型。 表格工具:斷定表。
語言工具:PDL——過程設計語言(結構化的英語和僞碼)。
【考點14】軟件測試的目標和準則
軟件測試的目標:發現程序中的錯誤。
軟件測試的準則:
(1)全部測試都是應追溯到需求。
(2)嚴格執行測試計劃,排除測試的隨意性。
(3)充分注意測試中的羣集表現。程序中存在錯誤的機率與該程序中已發現的錯誤數成正比。
(4)程序員應避免檢查本身的程序。
(5)窮舉測試不可能。窮舉測試是把程序全部可能的執行路徑都進行檢查,即便小規模的程序的執行路徑數也至關大,不可能窮盡,說明測試只能證實程序有錯,不能證實程序中無錯。
(6)妥善保存測試計劃,測試用例出錯統計和最終分析報告。
【考點15】軟件測試方法
從是否須要執行被測軟件的角度分爲靜態測試和動態測試; 按功能分爲白盒測試和黑盒測試 。
一、靜態測試和動態測試
靜態測試包括代碼檢查、靜態結構分析、代碼質量度量。不實際運行軟件,主要經過人工進行。
動態測試是經過運行軟件來檢驗軟件中的動態行爲和運行結果的正確性。動態測試的關鍵是使用設計高效、合理的測試用例。
測試用例就是爲測試設計的數據,由測試輸入數據(輸入值集)和預期的輸出結果(輸出值集)兩部份組成。
測試用例的設計方法通常分爲兩類: 黑盒測試方法和白盒測試方法。
二、白盒測試和黑盒測試
(1)白盒測試
白盒測試也稱爲結構測試或邏輯測試,是把程序當作裝在一隻透明的白盒子裏,測試者徹底瞭解程序的結構和處理過程。它根據程序的內部邏輯來設計測試用例,檢查程序中的邏輯通路是否都按預約的要求正確地工做。 白盒測試的基本原則:
(1)保證所測模塊中每一獨立路徑至少執行一次。
(2)保證所測模塊全部判斷的每一分支至少執行一次。
(3)保證所測模塊每一循環都在邊界條件和通常條件下至少各執行一次。
(4)驗證全部內部數據結構的有效性。
(5)按照白盒測試的基本原則,「白盒」法是窮舉路徑測試。
白盒測試的方法:邏輯覆蓋,基本路徑測試。
(2)黑盒測試
黑盒測試也稱功能測試或數據驅動測試,是把程序當作一隻黑盒子,測試者徹底不瞭解,或不考慮程序的結構和處理過程。它根據規格說明書的功能來設計測試用例,檢查程序的功能是否符合規格說明的要求。
黑盒測試的方法:等價劃分法,邊界值分析法,錯誤推測法。
【考點16】軟件測試的實施
軟件測試過程分4個步驟,即單元測試、集成測試、驗收測試和系統測試。 單元測試是對軟件設計的最小單位——模塊進行正確性檢驗的測試,單元測試的根據是源程序和詳細設計說明書,單元測試的技術能夠採用靜態分析和動態測試。
單元測試期間對模塊進行的測試:模塊接口,局部數據結構,重要的執行通路,出錯處理通路,邊界條件。
驅動模塊至關於被測模塊的主程序,它接收測試數據,並傳給所測模塊,輸出實際測試結果
樁模塊一般用於代替被測模塊調用的其餘模塊,其做用僅作少許的數據操做,是一個模擬子程序。
集成測試是測試和組裝軟件的系統化技術,主要目的是發現與接口有關的錯誤,集成測試的依據是概要設計說明書。
集成測試的方法:非增量方式組裝和增量方法組裝。
增量方式包括自頂而下的增量方式,自底而上的增量方式和混合增量方式。
【考點17】程序調試
在對程序進行了成功的測試以後將進入程序調試(一般稱Debug,即排錯) 程序的調試任務是診斷和改正程序中的錯誤。
程序調試和軟件測試的區別:
(2)軟件測試貫穿整個軟件生命期,調試主要在開發階段。 程序調試的基本步驟:
(1)錯誤定位。從錯誤的外部表現形式入手,研究有關部分的程序,肯定程序中出錯位置,找出錯誤的內在緣由;
(2)修改設計和代碼,以排除錯誤;
(3)進行迴歸測試,防止引進新的錯誤。
軟件調試可分爲靜態調試和動態調試。靜態調試主要是指經過人的思惟來分析源程序代碼和排錯,是主要的設計手段,而動態調試是輔助靜態調試的。
主要的調試方法有:
(2)回溯法;
(3)緣由排除法,包括演繹法,概括法和二分法。
第四章
數據庫設計基礎
【考點1】數據庫的基本概念
數據(Data)是數據庫存儲的基本對象,是描述事物的符號記錄。
數據庫(DB)是長期儲存在計算機內、有組織的、可共享的大量數據的集合,它具備統一的結構形式並存放於統一的存儲介質內,是多種應用數據的集成,並可被各個應用程序所共享,因此數據庫技術的根本目標是解決數據共享問題。
數據庫管理系統(DBMS)是數據庫的管理機構,負責數據庫中的數據組織、數據操縱、數據維護、控制及保護和數據服務等。數據庫管理系統是數據庫系統的核心。數據庫系統包含數據庫和數據庫管理系統。
數據庫管理系統的功能:
(1)數據模式定義:即爲數據庫構建其數據框架;
(2)數據存取的物理構建:爲數據模式的物理存取與構建提供有效的存取方法與手段;
(3)數據操縱:爲用戶使用數據庫的數據提供方便,如查詢、插入、修改、刪除等以及簡單的算術運算及統計;
(4)數據的完整性、安全性定義與檢查;
(5)數據庫的併發控制與故障恢復;
(6)數據的服務:如拷貝、轉存、重組、性能監測、分析等。
爲完成數據庫管理系統的功能,數據庫管理系統提供相應的數據語言:
數據語言按使用方式具備兩個結構形式:交互式命令語言(自含型和自主型語言)和宿主型語言。
數據庫管理員(DBA)的工做:數據庫設計,數據庫維護,改善系統性能,提升系統效率。
數據庫系統(DBS)是指在計算機系統中引入數據庫後的系統,通常由數據庫、數據庫管理系統、應用系統、數據庫管理員和用戶構成。
數據庫應用系統(DBAS)是數據庫系統再加上應用軟件及應用界面這三者所組成,具體包括:數據庫、數據庫管理系統、數據庫管理員、硬件平臺、軟件平臺、應用軟件、應用界面。
【考點2】數據管理的發展和基本特色
數據管理技術的發展經歷了三個階段:人工管理階段、文件系統階段和數據庫系統階段,數據獨立性最高的階段是數據庫系統階段。
人工管理階段特色:
文件系統階段的缺陷:
(1)數據冗餘(2)不一致性(3)數據聯繫弱。
數據庫系統的發展階段:第一代的網狀、層次數據庫系統;第二代的關係數據庫系統;第三代的以面向對象模型爲主要特徵的數據庫系統。
數據庫系統的基本特色:
(1)數據的高集成性
(3)數據高獨立性
(4)數據統一管理與控制。
數據獨立性是數據與程序間的互不依賴性,即數據庫中的數據獨立於應用程序而不依賴於應用程序。
數據的獨立性通常分爲物理獨立性與邏輯獨立性兩種。
(1)物理獨立性:當數據的物理結構(包括存儲結構、存取方式等)改變時,其邏輯結構,應用程序都不用改變。
(2)邏輯獨立性:數據的邏輯結構改變了,如修改數據模式、增長新的數據類型、改變數據間聯繫等,用戶的應用程序能夠不變。
【考點3】數據系統的內部結構體系
一、數據統系統的三級模式:
(1)概念模式,也稱邏輯模式,是對數據庫系統中全局數據邏輯結構的描述,是全體用戶公共數據視圖。一個數據庫只有一個概念模式。
(2)外模式,外模式也稱子模式,它是數據庫用戶可以看見和使用的局部數據的邏輯結構和特徵的描述,一個概念模式能夠有若干個外模式。
(3)內模式,內模式又稱物理模式,它給出了數據庫物理存儲結構與物理存取方法。一個數據庫只有一個內模式。內模式處於最底層,它反映了數據在計算機物理結構中的實際存儲形式,概念模式處於中間層,它反映了設計者的數據全局邏輯要求,而外模式處於最外層,它反映了用戶對數據的要求。
二、數據庫系統的兩級映射
兩級映射保證了數據庫系統中數據的獨立性。
(1)概念模式到內模式的映射。該映射給出了概念模式中數據的全局邏輯結構到數據的物理存儲結構間的對應關係;
(2)外模式到概念模式的映射。概念模式是一個全局模式而外模式是用戶的局部模式。一個概念模式中能夠定義多個外模式,而每一個外模式是概念模式的一個基本視圖。
【考點4】數據模型的基本概念
數據模型按不一樣的應用層次分爲:
概念數據模型:簡稱概念模型,是一種面向客觀世界,面向用戶的模型,不涉及具體的硬件環境和平臺也與具體的軟件環境無關的模式,它是整個數據模型的基礎。
邏輯數據模型:又稱數據模型,它是一種面向數據庫的模型。分爲層次模型,網狀模型,關係模型和麪向對象模型,其中層次模型和網狀模型統稱爲非關係模型。層次模型用樹型結構表示實體之間聯繫的模型。
物理數據模型:又稱物理模型,它是一種面向計算機物理表示的模型。
【考點5】E—R模型
一、E-R模型的基本概念
(1)實體:現實世界中的事物能夠抽象成爲實體,實體是概念世界中的基本單位,它們是客觀存在的且又能相互區別的事物。
(2)屬性:現實世界中事物均有一些特性,這些特性能夠用屬性來表示。
(3)碼:惟一標識實體的屬性集稱爲碼。
(4)域:屬性的取值範圍稱爲該屬性的域。
(5)聯繫:在現實世界中事物間的關聯稱爲聯繫。 兩個實體集間的聯繫其實是實體集間的函數關係,這種函數關係能夠有下面幾種:一對一的聯繫、一對多或多對一聯繫、多對多。
二、E-R模型的的圖示法
E-R模型用E-R圖來表示,E-R圖包含了表示實體集、屬性和聯繫的方法。
(2)屬性的表示:用橢圓形表示屬性,在橢圓形內寫上該屬性的名稱。
(3)聯繫的表示:用菱形表示聯繫,菱形內寫上聯繫名。
【考點6】層次模型和網狀模型
層次模型是有根的定向有序樹,是數據庫系統中最先出現的數據模型。網狀模型對應的是有向圖。
層次模型和網狀模型各自應知足的條件
層次模型:
(2)根之外的其餘結點有且只有一個雙親結點
網狀模型 :
(1)容許一個以上的結點無雙親
(2)一個結點能夠有多於一個的雙親
【考點7】關係模型及相關概念
關係模式採用二維表來表示,由關係數據結構,關係操縱和關係完整性約束3部分組成,在關係數據庫中,用來表示實體間聯繫的是關係。
關係:一個關係對應一張二維表。一個關係就是一個二維表,可是一個二維表不必定是一個關係。
元組:表中的一行即爲一個元組。
屬性:表中的一列即爲一個屬性,給每個屬性起一個名稱即屬性名。
份量:元組中的一個屬性值,是不可分割的基本數據項。
域:屬性的取值範圍。
在二維表中唯一標識元組的最小屬性值稱爲該表的鍵或碼。二維表中可能有若干個鍵,它們稱爲表的候選碼或候選鍵。從二維表的全部候選鍵選取一個做爲用戶使用的鍵稱爲主鍵或主碼。表A中的某屬性集是某表B的鍵,則稱該屬性值爲A的外鍵或外碼。
關係操縱:數據查詢、數據的刪除、數據插入、數據修改。
關係模型容許定義三類數據約束,它們是實體完整性約束、參照完整性約束以及用戶定義的完整性約束。其中實體完整性約束、參照完整性約束必須知足的完整性約束條件。參照完整性約束不容許關係應用不存在的元組。
實體完整性約束要求關係的主鍵中屬性值不能爲空,這是數據庫完整性的最基本要求。
【考點8】關係代數
關係代數是一種抽象的查詢語言,關係代數的運算對象是關係,運算結果也是關係。運算對象,運算符和運算結果是運算的三大要素。集合運算符,專門的運算符,算術比較符和邏輯運算符。
關係模型的基本運算:(1)插入(2)刪除 (3)修改(4)查詢(包括投影、選擇、笛卡爾積運算)還有擴充運算交、除、鏈接及天然鏈接運算。 關係代數的5個基本操做中並,差,交,笛卡爾積是二目運算。
設關係R和S具備相同的關係模式
二、差:R和S的差是由屬於R可是不屬於S的元組構成的集合
三、笛卡爾積:設R和S的元數分別爲r和s,R和S的笛卡爾積是一個(r+s)元的元組集合,每一個元組的前r個份量來自R的一個元組,後s個份量來自S的一個元組。運算後獲得的新表的元組數是R*S,屬性是r+s。
四、交:屬於R又屬於S的元組構成的集合。
五、投影:一元運算,對一個關係進行垂直切割,消去某些列,並從新按排列的順序。
六、選擇:一元運算,根據某些條件對關係進行水平分割。即選擇符合條件的元組。
七、除:給定關係R(X,Y)和S(Y,Z),其中X,Y,Z是屬性組,R中的Y和S中Y能夠有不一樣的屬性名,但必須出自相同的域集。
八、鏈接:也稱θ鏈接運算,是一種二元運算,它的操做是從兩個關係的笛卡爾積中選取屬性間知足必定條件的元組,以合併成一個大關係。鏈接運算包括等值鏈接和不等值鏈接。鏈接運算後獲得的新表的屬性是運算前表中屬性相加。即多於原來關係中屬性的個數。
九、天然鏈接:天然鏈接知足的條件是:
(1)兩關係間有公共域
(2)經過公共域的相等值進行鏈接。
【考點9】數據庫設計和管理
數據庫設計中有兩種方法,面向數據的方法和麪向過程的方法。面向數據的方法是以信息需求爲主,兼顧處理需求;面向過程的方法是以處理需求爲主,兼顧信息需求。因爲數據在系統中穩定性高,數據已成爲系統的核心,所以面向數據的設計方法已成爲主流。
數據庫設計目前通常採用生命週期法,即將整個數據庫應用系統的開發分解成目標獨立的若干階段。
它們是:需求分析階段、概念設計階段、邏輯設計階段、物理設計階段。
一個低一級範式的關係模式,經過模式分解能夠轉化爲若干個高一級範式的關係模式的集合,這種過程就叫規範化。
概念結構設計是將需求分析階段獲得的用戶需求抽象爲信息結構即概念模型的過程,它是整個數據庫設計的關鍵。
邏輯結構設計的任務是將E—R圖轉換成關係數據模型的過程。 數據庫的物理結構是指數據庫在物理設備上的存儲結構和存取方法。它依賴於給定的計算機系統。
經常使用的存取方法:索引方法,聚簇方法和HASH方法。
數據庫管理的內容:
(2)數據庫的重組。
(3)數據庫安全性控制。
(4)數據庫的完整性控制,數據庫的完整性是指數據的正確性和相容性。
(5)數據庫的故障恢復。
(6)數據庫監控。