一 對比關係
SQL術語/概念
|
MongoDB術語/概念
|
解釋/說明
|
database |
database |
數據庫 |
table |
collection |
數據庫表/集合 |
row |
document |
數據記錄行/文檔 |
column |
field |
數據字段/域 |
index |
index
|
索引 |
table joins |
|
錶鏈接,MongoDB不支持 |
primary key |
primary key |
主鍵,MongoDB自動將_id字段設置爲主鍵 |
二 主要概念
2.1 數據庫
一個MongoDB能夠創建多個數據庫,MongoDB默認數據庫爲"db",該數據庫存儲在data目錄中。
MongoDB的單個實例能夠容納多個獨立的數據庫,每個都有本身的集合和權限,不一樣的數據庫也放置在不一樣的文件中。
"show dbs" 命令能夠顯示全部數據的列表。
1 [root@mongodb1 ~]# mongo
2 > show dbs #顯示全部數據
3 admin 0.000GB
4 config 0.000GB
5 local 0.000GB
6 > db #顯示當前數據庫
7 test
8 > use local #切換數據庫
提示:數據庫可使用除如下限制外的全部字符串:
- 不能是空字符串("")。
- 不得含有' '(空格)、.、$、/、\和\0 (空字符)。
- 應所有小寫。
- 最多64字節。
系統保留部分數據庫名,用於特殊使用,以下所示:
- admin: 從權限的角度來看,這是"root"數據庫。要是將一個用戶添加到這個數據庫,這個用戶自動繼承全部數據庫的權限。一些特定的服務器端命令也只能從這個數據庫運行,好比列出全部的數據庫或者關閉服務器;
- local: 這個數據永遠不會被複制,能夠用來存儲限於本地單臺服務器的任意集合;
- config: 當Mongo用於分片設置時,config數據庫在內部使用,用於保存分片的相關信息。
2.2 文檔
Document是一組鍵值(key-value)對(即 BSON)。MongoDB 的文檔不須要設置相同的字段,而且相同的字段不須要相同的數據類型,這與關係型數據庫有很大的區別,也是 MongoDB 很是突出的特色,示例以下:
1 {"site":"www.linuxsb.com", "name":"Linux超級男孩"}
RDBMS
|
MongoDB |
數據庫
|
數據庫
|
表格
|
集合
|
行
|
文檔
|
列
|
字段
|
表聯合
|
嵌入文檔
|
主鍵
|
主鍵 (MongoDB 提供了 key 爲 _id )
|
MySQL和MongoDB服務客戶端對比:
服務端 |
Mysqld/Oracle |
mongod |
客戶端 |
mysql/sqlplus |
mongo |
提示:
- 文檔中的鍵/值對是有序的。
- 文檔中的值不只能夠是在雙引號裏面的字符串,還能夠是其餘幾種數據類型(甚至能夠是整個嵌入的文檔)。
- MongoDB區分類型和大小寫。
- MongoDB的文檔不能有重複的鍵。
- 文檔的鍵是字符串。除了少數例外狀況,鍵可使用任意UTF-8字符。
文檔鍵命名規範:
- 鍵不能含有\0 (空字符)。這個字符用來表示鍵的結尾。
- .和$有特別的意義,只有在特定環境下才能使用。
- 如下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。
2.3 集合
集合就是 MongoDB 文檔組,相似於 RDBMS (關係數據庫管理系統中的表格)。
集合存在於數據庫中,集合沒有固定的結構,這意味着在對集合能夠插入不一樣格式和類型的數據,但一般狀況下插入集合的數據都會有必定的關聯性。
好比,能夠將如下不一樣數據結構的文檔插入到集合中:
1 {"site":"www.baidu.com"}
2 {"site":"www.google.com","name":"Google"}
3 {"site":"www.linuxsb.com","name":"Linux超級男孩"}
當第一個文檔插入時,集合就會被建立。
集合命名規範:
- 集合名不能是空字符串""。
- 集合名不能含有\0字符(空字符),這個字符表示集合名的結尾。
- 集合名不能以"system."開頭,這是爲系統集合保留的前綴。
- 用戶建立的集合名字不能含有保留字符。有些驅動程序的確支持在集合名裏面包含,這是由於某些系統生成的集合中包含該字符。除非要訪問這種系統建立的集合,不然千萬不要在名字裏出現$。
以下實例:
2.3.1 capped collections
Capped collections 就是固定大小的collection。
它有很高的性能以及隊列過時的特性(過時按照插入的順序)。
Capped collections 是高性能自動的維護對象的插入順序。它很是適合相似記錄日誌。Capped collections 的功能和標準的 collection 不一樣,必需要顯式的建立一個capped collection,指定一個 collection 的大小,單位是字節。collection 的數據存儲空間值提早分配的。
Capped collections 能夠按照文檔的插入順序保存到集合中,並且這些文檔在磁盤上存放位置也是按照插入順序來保存的,因此當咱們更新Capped collections 中文檔的時候,更新後的文檔不能夠超過以前文檔的大小,這樣話就能夠確保全部文檔在磁盤上的位置一直保持不變。
因爲 Capped collection 是按照文檔的插入順序而不是使用索引肯定插入位置,這樣的話能夠提升增添數據的效率。MongoDB 的操做日誌文件 oplog.rs 就是利用 Capped Collection 來實現的。
要注意的是指定的存儲大小包含了數據庫的頭信息。
db.createCollection("mycoll", {capped:true, size:100000})
- 在 capped collection 中,能添加新的對象。
- 能進行更新,然而,對象不會增長存儲空間。若是增長,更新就會失敗 。
- 使用 Capped Collection 不能刪除一個文檔,可使用 drop() 方法刪除 collection 全部的行。
- 刪除以後,必須顯式的從新建立這個 collection。
- 在32bit機器中,capped collection 最大存儲爲 1e9( 1X109)個字節。
2.4 元數據
數據庫的信息是存儲在集合中。它們使用了系統的命名空間:
dbname.system.*
在MongoDB數據庫中名字空間 <dbname>.system.* 是包含多種系統信息的特殊集合(Collection),以下:
集合命名空間 |
描述 |
dbname.system.namespaces |
列出全部名字空間。 |
dbname.system.indexes |
列出全部索引。 |
dbname.system.profile |
包含數據庫概要(profile)信息。 |
dbname.system.users |
列出全部可訪問數據庫的用戶。 |
dbname.local.sources |
包含複製對端(slave)的服務器信息和狀態。 |
對於修改系統集合中的對象有以下限制。
在{{system.indexes}}插入數據,能夠建立索引。但除此以外該表信息是不可變的(特殊的drop index命令將自動更新相關信息);
{{system.users}}是可修改的;
{{system.profile}}是可刪除的。
三 MongoDB數據類型
3.1 經常使用數據類型
數據類型
|
描述
|
String
|
字符串。存儲數據經常使用的數據類型。在 MongoDB 中,UTF-8 編碼的字符串纔是合法的。
|
Integer
|
整型數值。用於存儲數值。根據你所採用的服務器,可分爲 32 位或 64 位。
|
Boolean
|
布爾值。用於存儲布爾值(真/假)。
|
Double
|
雙精度浮點值。用於存儲浮點值。
|
Min/Max keys
|
將一個值與 BSON(二進制的 JSON)元素的最低值和最高值相對比。
|
Array
|
用於將數組或列表或多個值存儲爲一個鍵。
|
Timestamp
|
時間戳。記錄文檔修改或添加的具體時間。
|
Object
|
用於內嵌文檔。
|
Null
|
用於建立空值。
|
Symbol
|
符號。該數據類型基本上等同於字符串類型,但不一樣的是,它通常用於採用特殊符號類型的語言。
|
Date
|
日期時間。用 UNIX 時間格式來存儲當前日期或時間。你能夠指定本身的日期時間:建立 Date 對象,傳入年月日信息。
|
Object ID
|
對象 ID。用於建立文檔的 ID。
|
Binary Data
|
二進制數據。用於存儲二進制數據。
|
Code
|
代碼類型。用於在文檔中存儲 JavaScript 代碼。
|
Regular expression
|
正則表達式類型。用於存儲正則表達式。
|
3.2 ObjectId
ObjectId 相似惟一主鍵,能夠很快的去生成和排序,包含 12 bytes,含義是:
- 前 4 個字節表示建立 unix 時間戳,格林尼治時間 UTC 時間,比北京時間晚了 8 個小時
- 接下來的 3 個字節是機器標識碼
- 緊接的兩個字節由進程 id 組成 PID
- 最後三個字節是隨機數
MongoDB 中存儲的文檔必須有一個 _id 鍵。這個鍵的值能夠是任何類型的,默認是個 ObjectId 對象
因爲 ObjectId 中保存了建立的時間戳,因此不須要爲文檔保存時間戳字段,能夠經過 getTimestamp 函數來獲取文檔的建立時間:
1 > var netObject = ObjectId()
2 > netObject.getTimestamp()
3 ISODate("2019-04-17T15:23:52Z")
3.3 字符串
BSON 字符串都是 UTF-8 編碼。
3.4 時間戳
BSON 有一個特殊的時間戳類型用於 MongoDB 內部使用,與普通的 日期 類型不相關。 時間戳值是一個 64 位的值。其中:
- 前32位是一個 time_t 值(與Unix新紀元相差的秒數)
- 後32位是在某秒中操做的一個遞增的序數
在單個 mongod 實例中,時間戳值一般是惟一的。
在複製集中, oplog 有一個 ts 字段。這個字段中的值使用BSON時間戳表示了操做時間。
提示:BSON 時間戳類型主要用於 MongoDB 內部使用。在大多數狀況下的應用開發中,可使用 BSON 日期類型。
3.5 日期
表示當前距離 Unix新紀元(1970年1月1日)的毫秒數。日期類型是有符號的, 負數表示 1970 年以前的日期。
1 > var mydate1 = new Date()
2 > mydate1
3 ISODate("2019-04-17T15:28:48.556Z")
4 > typeof mydate1
5 object
6 > var mydate2 = ISODate()
7 > mydate2
8 ISODate("2019-04-17T15:29:01.267Z")
9 > typeof mydate2
10 object
11 > Date()
12 Wed Apr 17 2019 23:30:17 GMT+0800 (CST)
原文連接:http://www.runoob.com/mongodb/mongodb-databases-documents-collections.html