數據庫基礎

1、楔子

假設如今你已是某大型互聯網公司的高級程序員,讓你寫一個火車票購票系統,來hold住十一期間全國的購票需求,你怎麼寫?mysql

因爲在同一時段搶票的人數太多,因此你的程序不可能寫在一臺機器上,應該是多臺機器一塊兒分擔用戶的購票請求。程序員

那麼問題就來了,票務信息的數據存在哪裏?存在文件裏麼?sql

若是存儲在文件裏,那麼存儲在哪一臺機器上呢?是每臺機器上都存儲一份麼?數據庫

首先,若是其中一臺機器上賣出的票另外兩臺機器是感知不到的,安全

其次,是若是咱們將數據和程序放在同一個機器上,若是程序和數據有一個出了問題都會致使整個服務不可用.。服務器

最後,是操做文件,修改文件對python代碼來講是一件很麻煩的事網絡

基於上面這些問題,單純的將數據存儲在和程序同一臺機器上的文件中是很是不明智的。數據結構

191-數據庫基礎-01.png?x-oss-process=style/watermark

2、爲何用數據庫

根據上面的例子,咱們已經知道:架構

  1. 將文件和程序存在一臺機器上是很不合理的。
  2. 操做文件是一件很麻煩的事

2.1 因此就出現了一個新的概念——數據

你能夠理解爲 數據庫 是一個能夠在一臺機器上獨立工做的,而且能夠給咱們提供高效、便捷的方式對數據進行增刪改查的一種工具。

如此就幫助咱們解決了上面出現的問題,若是將全部的數據都存儲在一個獨立的機器上,而對用戶提供服務的機器只是存放你寫的代碼。

191-數據庫基礎-02.png?x-oss-process=style/watermark

2.2 數據庫的優點

  1. 程序穩定性 :這樣任意一臺服務所在的機器崩潰了都不會影響數據和另外的服務。
  2. 數據一致性 :全部的數據都存儲在一塊兒,全部的程序操做的數據都是統一的,就不會出現數據不一致的現象
  3. 併發 :數據庫能夠良好的支持併發,全部的程序操做數據庫都是經過網絡,而數據庫自己支持併發的網絡操做,不須要咱們本身寫socket
  4. 效率 :使用數據庫對數據進行增刪改查的效率要高出咱們本身處理文件不少

3、認識數據庫

3.1 什麼是數據(Data)

描述事物的符號記錄稱爲數據,描述事物的符號既能夠是數字,也能夠是文字、圖片,圖像、聲音、語言等,數據由多種表現形式,它們均可以通過數字化後存入計算機

在計算機中描述一個事物,就須要抽取這一事物的典型特徵,組成一條記錄,就至關於文件裏的一行內容,如:tank,不詳,83,1935,廣東,oldboy

單純的一條記錄並無任何意義,若是咱們按逗號做爲分隔,依次定義各個字段的意思,至關於定義表的標題:

id,name,sex,age,birth,born_addr,company # 字段/列名
1,tank,不詳,83,1935,山東,oldboy # 數據

這樣咱們就能夠了解tank,性別不詳,年齡83歲,出生於1935年,住的養老院是老男孩

3.2 什麼是數據庫(DataBase,簡稱DB)

數據庫即存放數據的倉庫,只不過這個倉庫是在計算機存儲設備上,並且數據是按必定的格式存放的。

過去人們將數據存放在文件櫃裏,如今數據量龐大,已經再也不適用。

數據庫是長期存放在計算機內、有組織、可共享的數據集合。

數據庫中的數據按必定的數據模型組織、描述和儲存,具備較小的冗餘度、較高的數據獨立性和易擴展性,並可爲各類用戶共享。

3.3 什麼是數據庫管理系統(DataBase Management System 簡稱DBMS)

在瞭解了Data與DB的概念後,如何科學地組織和存儲數據,如何高效獲取和維護數據成了關鍵。

這就用到了一個系統軟件---數據庫管理系統,如MySQL、Oracle、SQLite、Access、MS SQL Server。

  • mysql主要用於大型門戶,例如搜狗、新浪等,它主要的優點就是開放源代碼,由於開放源代碼這個數據庫是免費的,他如今是甲骨文公司的產品。

  • oracle主要用於銀行、鐵路、飛機場等。該數據庫功能強大,軟件費用高。也是甲骨文公司的產品。

  • sql server是微軟公司的產品,主要應用於大中型企業,如聯想、方正等。

而對數據庫管理的人員通常稱之爲:數據庫管理員 DBA(Database Administrator)

3.4 數據庫服務器、數據管理系統、數據庫、表與記錄的關係(重點)

記錄:1 老王 15201413111 22(多個字段的信息組成一條記錄,即文件中的一行內容)

表:userinfo,studentinfo,courseinfo(即文件)

數據庫:db(即文件夾)

數據庫管理系統:如mysql(是一個軟件)

數據庫服務器:一臺計算機(對內存要求比較高)

總結:

  • 數據庫服務器:運行數據庫管理軟件
  • 數據庫管理軟件:管理數據庫
  • 數據庫:即文件夾,用來組織文件/表
  • 表:即文件,用來存放多行內容/多條記錄

4、數據庫管理技術的發展歷程(瞭解)

4.1 人工管理階段

20世紀50年代中期之前,計算機主要用於科學計算。

當時的硬件水平:外存只有紙帶、卡片、磁帶,沒有磁盤等直接存取的存儲設備

當時的軟件情況:沒有操做系統,沒有管理數據的軟件,數據的處理方式是批處理。

人工管理數據具備如下特色:

  1. 數據不保存:計算機主要用於科學計算,數據臨時用,臨時輸入,不保存
  2. 應用程序管理數據:數據要有應用程序本身管理,應用程序須要處理數據的邏輯+物理結構,開發負擔很重
  3. 數據不共享:一組數據只對應一個程序,多個程序之間涉及相同數據時,必須各自定義,形成數據大量冗餘
  4. 數據不具備獨立性:數據的邏輯結構或物理結構發生變化後,必須對應用程序作出相應的修改,開發負擔進一步加大

191-數據庫基礎-03.png?x-oss-process=style/watermark

4.2 文件系統階段

20世紀50年代後期到60年代中期

硬件水平:有了磁盤、磁鼓等可直接存取的存儲設備

軟件水平:有了操做系統,而且操做系統中已經有了專門的數據管理軟件,即文件系統;處理方式上不只有了批處理,並且可以聯機實時處理

文件系統管理數據具備如下優勢:

  1. 數據能夠長期保存:計算機大量用於數據處理,於是數據須要長期保存,進行增刪改查操做
  2. 由文件系統管理數據:文件系統這個軟件,把數據組織成相對獨立的數據文件,利用按文件名,按記錄進行存取。實現了記錄內的結構性,但總體無結構。而且程序與數據之間由文件系統提供存取方法進行轉換,是應用程序與數據之間有了必定的獨立性,程序員能夠沒必要過多考慮物理細節。

文件系統管理數據具備如下缺點:

  1. 數據共享性差,冗餘度大:一個文件對應一個應用程序,不一樣應用有相同數據時,也必須創建各自的文件,不能共享相同的數據,形成數據冗餘,浪費空間,且相同的數據重複存儲,各自管理,容易形成數據不一致性
  2. 數據獨立性差:一旦數據的邏輯結構改變,必須修改應用程序,修改文件結構的定義。應用程序的改變,也將引發文件的數據結構的改變。所以數據與程序之間缺少獨立性。可見,文件系統仍然是一個不具備彈性的無結構的數據集合,即文件之間是孤立的,不能反映現實世界事物之間的內存聯繫。

191-數據庫基礎-04.png?x-oss-process=style/watermark

4.3 數據系統階段

20世紀60年代後期以來,計算機用於管理的規模愈來愈大,應用愈來愈普遍,數據量急劇增加,同時多種應用,多種語言互相覆蓋地共享數據結合要求愈來愈強烈

硬件水平:有了大容量磁盤,硬件架構降低

軟件水平:軟件價格上升(開發效率必須提高,必須將程序員從數據管理中解放出來),分佈式的概念盛行。

數據庫系統的特色:

  1. 數據結構化(如上圖odboy_stu)
  2. 數據共享,冗餘度低,易擴充
  3. 數據獨立性高
  4. 數據由DBMS統一管理和控制
    1. 數據的安全性保護
    2. 數據的完整性檢查
    3. 併發控制
    4. 數據庫恢復
相關文章
相關標籤/搜索