假設如今你已是某大型互聯網公司的高級程序員,讓你寫一個火車票購票系統,來hold住十一期間全國的購票需求,你怎麼寫?python
因爲在同一時段搶票的人數太多,因此你的程序不可能寫在一臺機器上,應該是多臺機器一塊兒分擔用戶的購票請求。mysql
那麼問題就來了,票務信息的數據存在哪裏?存在文件裏麼?程序員
若是存儲在文件裏,那麼存儲在哪一臺機器上呢?是每臺機器上都存儲一份麼?redis
首先,若是其中一臺機器上賣出的票另外兩臺機器是感知不到的,sql
其次,是若是咱們將數據和程序放在同一個機器上,若是程序和數據有一個出了問題都會致使整個服務不可用mongodb
最後,是操做文件,修改文件對python代碼來講是一件很麻煩的事數據庫
基於上面這些問題,單純的將數據存儲在和程序同一臺機器上的文件中是很是不明智的。編程
根據上面的例子,咱們已經知道:安全
第一,將文件和程序存在一臺機器上是很不合理的。 第二,操做文件是一件很麻煩的事
因此就出現了一個新的概念 —— 數據庫服務器
你能夠理解爲 數據庫 是一個能夠在一臺機器上獨立工做的,而且能夠給咱們提供高效、便捷的方式對數據進行增刪改查的一種工具。
如此就幫助咱們解決了上面出現的問題,若是將全部的數據都存儲在一個獨立的機器上,而對用戶提供服務的機器只是存放你寫的代碼。
1.程序穩定性 :這樣任意一臺服務所在的機器崩潰了都不會影響數據和另外的服務。 2.數據一致性 :全部的數據都存儲在一塊兒,全部的程序操做的數據都是統一的,就不會出現數據不一致的現象 3.併發 :數據庫能夠良好的支持併發,全部的程序操做數據庫都是經過網絡,而數據庫自己支持併發的網絡操做,不須要咱們本身寫socket 4.效率 :使用數據庫對數據進行增刪改查的效率要高出咱們本身處理文件不少
描述事物的符號記錄稱爲數據,描述事物的符號既能夠是數字,也能夠是文字、圖片,圖像、聲音、語言等,數據由多種表現形式,它們均可以通過數字化後存入計算機
在計算機中描述一個事物,就須要抽取這一事物的典型特徵,組成一條記錄,就至關於文件裏的一行內容,如:
1 xiaobai,不詳,83,1935,山東,beijing
單純的一條記錄並無任何意義,若是咱們按逗號做爲分隔,依次定義各個字段的意思,至關於定義表的標題
id,name,sex,age,birth,born_addr,company # 字段/列名
1,xiaobai,不詳,83,1935,山東,beijing # 數據
這樣咱們就能夠了解小白,性別不詳,年齡83歲,出生於1935年,住的北京
數據庫即存放數據的倉庫,只不過這個倉庫是在計算機存儲設備上,並且數據是按必定的格式存放的
過去人們將數據存放在文件櫃裏,如今數據量龐大,已經再也不適用
數據庫是長期存放在計算機內、有組織、可共享的數據集合。
數據庫中的數據按必定的數據模型組織、描述和儲存,具備較小的冗餘度、較高的數據獨立性和易擴展性,並可爲各類 用戶共享
DataBase Management System 簡稱DBMS
在瞭解了Data與DB的概念後,如何科學地組織和存儲數據,如何高效獲取和維護數據成了關鍵
這就用到了一個系統軟件---數據庫管理系統
如MySQL、Oracle、SQLite、Access、MS SQL Server
mysql主要用於大型門戶,例如搜狗、新浪等,它主要的優點就是開放源代碼,由於開放源代碼這個數據庫是免費的,他如今是甲骨文公司的產品。
oracle主要用於銀行、鐵路、飛機場等。該數據庫功能強大,軟件費用高。也是甲骨文公司的產品。
sql server是微軟公司的產品,主要應用於大中型企業,如聯想、方正等。
記錄:1 朱葛 13234567890 22(多個字段的信息組成一條記錄,即文件中的一行內容)
表:userinfo,studentinfo,courseinfo(即文件)
數據庫:db(即文件夾)
數據庫管理系統:如mysql(是一個軟件)
數據庫服務器:一臺計算機(對內存要求比較高)
總結:
數據庫服務器-:運行數據庫管理軟件
數據庫管理軟件:管理-數據庫
數據庫:即文件夾,用來組織文件/表
表:即文件,用來存放多行內容/多條記錄
一 人工管理階段
20世紀50年代中期之前,計算機主要用於科學計算。
當時的硬件水平:外存只有紙帶、卡片、磁帶,沒有磁盤等直接存取的存儲設備
當時的軟件情況:沒有操做系統,沒有管理數據的軟件,數據的處理方式是批處理。
人工管理數據具備如下特色:
1 數據不保存:計算機主要用於科學計算,數據臨時用,臨時輸入,不保存
2 應用程序管理數據:數據要有應用程序本身管理,應用程序須要處理數據的邏輯+物理結構,開發負擔很重
3 數據不共享:一組數據只對應一個程序,多個程序之間涉及相同數據時,必須各自定義,形成數據大量冗餘
4 數據不具備獨立性:數據的邏輯結構或物理結構發生變化後,必須對應用程序作出相應的修改,開發負擔進一步加大
二 文件系統階段
20世紀50年代後期到60年代中期
硬件水平:有了磁盤、磁鼓等可直接存取的存儲設備
軟件水平:有了操做系統,而且操做系統中已經有了專門的數據管理軟件,即文件系統;處理方式上不只有了批處理,並且可以聯機實時處理
文件系統管理數據具備如下優勢:
1 數據能夠長期保存:計算機大量用於數據處理,於是數據須要長期保存,進行增刪改查操做
2 由文件系統管理數據:文件系統這個軟件,把數據組織成相對獨立的數據文件,利用按文件名,按記錄進行存取。實現了記錄內的結構性,但總體無結構。而且程序與數據之間由文件系統提供存取方法進行轉換,是應用程序與數據之間有了必定的獨立性,程序員能夠沒必要過多考慮物理細節。
文件系統管理數據具備如下缺點:
1 數據共享性差,冗餘度大:一個文件對應一個應用程序,不一樣應用有相同數據時,也必須創建各自的文件,不能共享相同的數據,形成數據冗餘,浪費空間,且相同的數據重複存儲,各自管理,容易形成數據不一致性
2 數據獨立性差:一旦數據的邏輯結構改變,必須修改應用程序,修改文件結構的定義。應用程序的改變,也將引發文件的數據結構的改變。所以數據與程序之間缺少獨立性。可見,文件系統仍然是一個不具備彈性的無結構的數據集合,即文件之間是孤立的,不能反映現實世界事物之間的內存聯繫。
三 數據系統階段
20世紀60年代後期以來,計算機用於管理的規模愈來愈大,應用愈來愈普遍,數據量急劇增加,同時多種應用,多種語言互相覆蓋地共享數據結合要求愈來愈強烈
硬件水平:有了大容量磁盤,硬件架構降低
軟件水平:軟件價格上升(開發效率必須提高,必須將程序員從數據管理中解放出來),分佈式的概念盛行。
數據庫系統的特色:
1 數據結構化(如上圖odboy_stu)
2 數據共享,冗餘度低,易擴充
3 數據獨立性高
4 數據由DBMS統一管理和控制
a:數據的安全性保護
b:數據的完整性檢查
c:併發控制
d:數據庫恢復
在咱們開始學習MySQL 數據庫前,讓咱們先了解下RDBMS的一些術語:
管理數據的工具備不少種,不止mysql一個。關於分類其實能夠從各個緯度來進行劃分,可是咱們最常使用的分類仍是根據他們存取數據的特色來劃分的,主要分爲關係型和非關係型。
能夠簡單的理解爲,關係型數據庫須要有表結構,非關係型數據庫是key-value存儲的,沒有表結構
關係型:如sqllite,db2,oracle,access,sql server,MySQL,注意:sql語句通用 非關係型:mongodb,redis,memcache
關係型數據庫(RDBMS):RDBMS(relational database management system)指的是關係型數據庫管理系統 例如: 學生的信息(學號、姓名、性別、年齡、籍貫|學號、專業、班級、課程....) ——>是以表的形式存在於數據庫中(成千上萬張表,而且表與表之間有相應的關係),那麼這樣的數據庫就是所謂的關係型數據庫 主流的關係型數據庫:oracle、mysql、DB2(IBM)、Sybase、SQL server(Microsoft微軟)、IBM Informix 關係型數據庫,是指採用了關係模型來組織數據的數據庫。簡單來講,關係模型指的就是二維表格模型。 優勢:容易理解、方便使用、數據一致、讀寫實時等 事務: 一組dml語句 inster update delete... commit rollback 特色: 一、原子性 -10000 +10000 2、一致性 三、隔離性 A=x B=y x=x1 y=y1 4、持久性 關係型數據庫的最大特色就是事務的一致性:因此也在對事物一致性的維護中有很大的開銷 1. 登錄ATM機,輸入密碼; 2. 鏈接數據庫,驗證密碼; 3. 驗證成功,得到用戶信息,好比餘額等; 4. 用戶輸入須要轉帳的金額,按下確認鍵; 5. 從後臺數據庫中減掉用戶帳戶上的對應金額; 6. 從後臺數據庫中給對方帳戶增長相應的金額; 7. 確認,退卡,走人; 對於上面的轉帳這個事情,若是有一步出現了錯誤,那麼就取消整個轉帳的動做; 簡單來講,就是轉帳這6步,要麼都完成,要麼就啥也不作。在數據庫中,事務也是這個道理。 事務:事務由一條或者多條sql語句組成,在事務中的操做,這些sql語句要麼都執行,要麼都不執行,這就是一個事務。 在關係型數據庫中,致使性能欠佳的最主要緣由是多表的關聯查詢,以及複雜的數據分析類型的複雜SQL報表查詢。 應用場景:一、對數據的一致性要求較高;二、對讀寫的實時性要求較高;三、典型的銀行及支付系統類;
非關係型數據庫:【nosql數據庫】 分佈式系統 大數據特色:海量、高速、多樣、價值 多樣:數據類型(結構化 半結構化 非結構化) | | | RDBMS XML-BLOG 圖片、音頻 常見的非關係型數據庫:MangoDB、Redis、Membase等 應用場景:一、對數據庫性能要求較高;二、須要靈活性更強的IT系統;三、不須要高度的數據一致性;
http://db-engines.com/en/ranking 查看數據庫排名
Oracle 對MySQL版本從新進行了劃分,分紅了社區版和企業版,企業版是須要收費的,固然收費的就會提供更多的功能。
社區版:MySQL Community Edition (GPL) --社區版 1、能夠看作是企業版的「普遍體驗版(小白鼠版)」,未經各個專有系統平臺的壓力測試和性能測試 2、基於GPL協議發佈,能夠隨意下載使用 3、沒有任何官方技術支持服務 企業版:MySQL Enterprise Edition --企業版 MySQL Cluster CGE -- 集羣版 1、提供了比較全面的高級功能、管理工具及技術支持 二、安全性、穩定性、可擴展性比較好
Mysql的獲取:
www.mysql.com