關係與非關係型數據庫關係型數據庫與NOSQL

時間 2019-12-10

標籤關係數據庫 nosql 欄目 SQL 简体版

原文原文鏈接

NoSQL,指的是非關係數據庫。由上面的敘述能夠看到關係型數據庫中的表都是存儲一下格式化的數據結構，每一個元組字段的組成都是同樣的，即便不是每一個元組都須要全部的字段，但數據庫會爲每一個元組都分配全部的字段，這樣的結構能夠便於表與表之間進行鏈接等操做，但從另外一個角度來講它也是關係數據庫性能瓶頸的一個因素。而非關係數據庫以鍵值對存儲，它的結構不固定，每個元組能夠有不同的字段，每一個元組能夠根據須要增長或減小一些本身的鍵值對，這樣就不會侷限於固定的結構，能夠減小一些時間和空間的開銷。

關係型數據庫以行和列的形式存儲數據，以便於用戶理解。這一系列的行和列被稱爲表，一組表組成了數據庫。用戶用查詢(Query)來檢索數據庫中的數據。一個Query是一個用於指定數據庫中行和列的SELECT語句。關係型數據庫一般包含下列組件：
　　客戶端應用程序(Client)
　　數據庫服務器(Server)
　　數據庫(Database)
　　Structured Query Language(SQL)Client端和Server端的橋樑，Client用SQL來象Server端發送請求，Server返回Client端要求的結果。如今流行的大型關係型數據庫有IBM DB二、IBM UDB、Oracle、SQL Server、SyBase、Informix等。
　　關係型數據庫管理系統中儲存與管理數據的基本形式是二維表。
關係型數據庫是一組已經被組織爲表結構的信息的集合。這些信息以表的形式被存儲於磁盤、磁帶等物理介質中。每一個表能夠有多行，而每行又被拆分紅多列。html

關係型數據庫一整套數學理論基礎，例如關係代數和關係運算是關係型數據庫的只要理論基礎。sql

平常生活中咱們對錶結構很是熟悉，例如學生的成績表，課程表等，這些表格都是以行和列的二維方式來將信息組織在一塊兒。這些信息能夠以各類形式存在，例如打印在紙上，顯示在電腦的屏幕上，記錄在人們的腦海裏，存在服務器的磁盤裏等等。數據庫

如今須要一種方便的手段來管理這些信息，最好是隨時能查詢，新增，刪除和更新的，這就是數據數組

關係：服務器

·關係是知足必定條件的二維表，表中的一行稱爲關係的一個元組，用來存儲事物的一個實例；表中數據結構

的一列稱爲關係的一個屬性，用來描述實體的某一特徵。表是由一組相關實體組成的集合。因此表和memcached

實體集這兩個詞經常能夠交替使用。post

·關係是一個行與列交叉的二維表，每一列（屬性）的全部數據都是同一種數據類型，每一列都有惟性能

一的列名，列在表中的順序可有可無；表中的任意兩行（元組）不能相同，行在表中的順序也無關緊大數據

要

關係的特徵：

·關係的每一行定義實體集的一個實體，每一列定義實體的一個屬性

·每一行必須有一個主碼，主碼是一個屬性組（能夠是一個屬性），它能惟一標識一個實體

·每一列表示一個屬性，且列名不能重複

·列的每一個值必須與對應屬性的類型相同

·列有取值範圍，稱爲域

·列是不可分割的最小數據項

·行、列的順序對用戶可有可無

關係型數據庫與NOSQL

關係型數據庫把全部的數據都經過行和列的二元表現形式表示出來。

關係型數據庫的優點：

1. 保持數據的一致性（事務處理）

2.因爲以標準化爲前提，數據更新的開銷很小（相同的字段基本上都只有一處）

3. 能夠進行Join等複雜查詢

其中可以保持數據的一致性是關係型數據庫的最大優點。

關係型數據庫的不足：

不擅長的處理

1. 大量數據的寫入處理

2. 爲有數據更新的表作索引或表結構（schema）變動

3. 字段不固定時應用

4. 對簡單查詢須要快速返回結果的處理

--大量數據的寫入處理

讀寫集中在一個數據庫上讓數據庫不堪重負，大部分網站已使用主從複製技術實現讀寫分離，以提升讀寫性能和讀庫的可擴展性。

因此在進行大量數據操做時，會使用數據庫主從模式。數據的寫入由主數據庫負責，數據的讀入由從數據庫負責，能夠比較簡單地經過增長從數據庫來實現規模化，可是數據的寫入卻徹底沒有簡單的方法來解決規模化問題。

第一，要想將數據的寫入規模化，能夠考慮把主數據庫從一臺增長到兩臺，做爲互相關聯複製的二元主數據庫使用，確實這樣能夠把每臺主數據庫的負荷減小一半，可是更新處理會發生衝突，可能會形成數據的不一致，爲了不這樣的問題，須要把對每一個表的請求分別分配給合適的主數據庫來處理。

第二，能夠考慮把數據庫分割開來，分別放在不一樣的數據庫服務器上，好比將不一樣的表放在不一樣的數據庫服務器上，數據庫分割能夠減小每臺數據庫服務器上的數據量，以便減小硬盤IO的輸入、輸出處理，實現內存上的高速處理。可是因爲分別存儲字不一樣服務器上的表之間沒法進行Join處理，數據庫分割的時候就須要預先考慮這些問題，數據庫分割以後，若是必定要進行Join處理，就必需要在程序中進行關聯，這是很是困難的。

--爲有數據更新的表作索引或表結構變動

在使用關係型數據庫時，爲了加快查詢速度須要建立索引，爲了增長必要的字段就必定要改變表結構，爲了進行這些處理，須要對錶進行共享鎖定，這期間數據變動、更新、插入、刪除等都是沒法進行的。若是須要進行一些耗時操做，例如爲數據量比較大的表建立索引或是變動其表結構，就須要特別注意，長時間內數據可能沒法進行更新。

--字段不固定時的應用

若是字段不固定，利用關係型數據庫也是比較困難的，有人會說，須要的時候加個字段就能夠了，這樣的方法也不是不能夠，但在實際運用中每次都進行反覆的表結構變動是很是痛苦的。你也能夠預先設定大量的預備字段，但這樣的話，時間一長很容易弄不清除字段和數據的對應狀態，即哪一個字段保存有哪些數據。

--對簡單查詢須要快速返回結果的處理（這裏的「簡單」指的是沒有複雜的查詢條件）

這一點稱不上是缺點，但無論怎樣，關係型數據庫並不擅長對簡單的查詢快速返回結果，由於關係型數據庫是使用專門的sql語言進行數據讀取的，它須要對sql與越南進行解析，同時還有對錶的鎖定和解鎖等這樣的額外開銷，這裏並非說關係型數據庫的速度太慢，而只是想告訴你們若但願對簡單查詢進行高速處理，則沒有必要非使用關係型數據庫不可。

---------------------------

NoSQL數據庫

關係型數據庫應用普遍，能進行事務處理和錶鏈接等複雜查詢。相對地，NoSQL數據庫只應用在特定領域，基本上不進行復雜的處理，但它偏偏彌補了以前所列舉的關係型數據庫的不足之處。

優勢：

易於數據的分散

各個數據之間存在關聯是關係型數據庫得名的主要緣由，爲了進行join處理，關係型數據庫不得不把數據存儲在同一個服務器內，這不利於數據的分散，這也是關係型數據庫並不擅長大數據量的寫入處理的緣由。相反NoSQL數據庫本來就不支持Join處理，各個數據都是獨立設計的，很容易把數據分散在多個服務器上，故減小了每一個服務器上的數據量，即便要處理大量數據的寫入，也變得更加容易，數據的讀入操做固然也一樣容易。

典型的NoSQL數據庫

臨時性鍵值存儲（memcached、Redis）、永久性鍵值存儲（ROMA、Redis）、面向文檔的數據庫（MongoDB、CouchDB）、面向列的數據庫（Cassandra、HBase）

1、鍵值存儲

它的數據是以鍵值的形式存儲的，雖然它的速度很是快，但基本上只能經過鍵的徹底一致查詢獲取數據，根據數據的保存方式能夠分爲臨時性、永久性和二者兼具三種。

（1）臨時性

所謂臨時性就是數據有可能丟失，memcached把全部數據都保存在內存中，這樣保存和讀取的速度很是快，可是當memcached中止時，數據就不存在了。因爲數據保存在內存中，因此沒法操做超出內存容量的數據，舊數據會丟失。總結來講：

。在內存中保存數據

。能夠進行很是快速的保存和讀取處理

。數據有可能丟失

（2）永久性

所謂永久性就是數據不會丟失，這裏的鍵值存儲是把數據保存在硬盤上，與臨時性比起來，因爲必然要發生對硬盤的IO操做，因此性能上仍是有差距的，但數據不會丟失是它最大的優點。總結來講：

。在硬盤上保存數據

。能夠進行很是快速的保存和讀取處理（但沒法與memcached相比）

。數據不會丟失

（3）二者兼備

Redis屬於這種類型。Redis有些特殊，臨時性和永久性兼具。Redis首先把數據保存在內存中，在知足特定條件（默認是 15分鐘一次以上，5分鐘內10個以上，1分鐘內10000個以上的鍵發生變動）的時候將數據寫入到硬盤中，這樣既確保了內存中數據的處理速度，又能夠經過寫入硬盤來保證數據的永久性，這種類型的數據庫特別適合處理數組類型的數據。總結來講：

。同時在內存和硬盤上保存數據

。能夠進行很是快速的保存和讀取處理

。保存在硬盤上的數據不會消失（能夠恢復）

。適合於處理數組類型的數據

2、面向文檔的數據庫

MongoDB、CouchDB屬於這種類型，它們屬於NoSQL數據庫，但與鍵值存儲相異。

（1）不定義表結構

　　即便不定義表結構，也能夠像定義了表結構同樣使用，還省去了變動表結構的麻煩。

（2）可使用複雜的查詢條件

　　跟鍵值存儲不一樣的是，面向文檔的數據庫能夠經過複雜的查詢條件來獲取數據，雖然不具有事務處理和Join這些關係型數據庫所具備的處理能力，但初次之外的其餘處理基本上都能實現。

3、面向列的數據庫

Cassandra、HBae、HyperTable屬於這種類型，因爲近年來數據量出現爆發性增加，這種類型的NoSQL數據庫尤爲引入注目。