摘要: MongoDB 因其靈活的文檔模型、可擴展分佈式設計廣受開發者喜好,在此基礎上,MongoDB 4.0 推出了更強大的功能支持,目前4.0第一個RC版本已經發布,本文將介紹 MongoDB 4.0 核心的一些新特性。數據庫
MongoDB 因其靈活的文檔模型、可擴展分佈式設計廣受開發者喜好,在此基礎上,MongoDB 4.0 推出了更強大的功能支持,目前4.0第一個RC版本已經發布,本文將介紹 MongoDB 4.0 核心的一些新特性。數組
多文檔事務(Multi-Document ACID Transaction)
結合 MongoDB 文檔模型內嵌數組、文檔的支持,目前的單文檔事務能知足絕大部分開發者的需求。爲了讓 MongoDB 能適應更多的應用場景,讓開發變得更簡單,MongoDB 4.0 將支持複製集內部跨一或多個集合的多文檔事務,保證針對多個文檔的更新的原子性。而在將來的 MongoDB 4.2 版本,還會支持分片集羣的分佈式事務。session
MongoDB 的事務接口很是簡單,開發者只須要將「須要保證原子性的更新序列」放到一個 session 的 開始事務 與提交事務之間便可。併發
以下是 Python API 使用事務的例子分佈式
with client.start_session() as s: s.start_transaction(): try: collection.insert_one(doc1, session=s) collection.insert_one(doc2, session=s) except: s.abort_transaction() raise s.commit_transaction()
以下是 Java API 使用事務的例子工具
try (ClientSession clientSession = client.startSession()) { clientSession.startTransaction(); try { collection.insertOne(clientSession, docOne); collection.insertOne(clientSession, docTwo); clientSession.commitTransaction(); } catch (Exception e) { clientSession.abortTransaction(); } }
事務是 MongoDB 開發團隊通過3年多努力的結果,從3.0版本引入 WiredTiger 、到3.2版本支持 ReadConcern、3.6 支持 Causal Consistency 等不少工做都是在爲事務功能作準備,最終在4.0版本將整個事務的API提供給用戶,幫助用戶更好的構建應用。性能
聚合類型轉換( Aggregation Pipeline Type Conversions)
靈活的文檔模型是 MongoDB 相比傳統關係型數據庫的一大優點,應用開發者無需爲存儲的數據預先定義結構(或者模式),這使得開發者能快速的應對開發需求的迭代;在靈活的同時,MongoDB 還提供了 schema validation 功能,使得開發者能夠根據須要定義文檔數據的模型。spa
MongoDB 的文檔容許用戶靈活的寫入各類類型的數據字段,這給消費數據帶了必定的複雜性,好比一些數據分析的場景,應用一般但願某個字段的數據擁有統一的類型,以方便數據處理。設計
MongoDB 4.0 引入了新的聚合操做符 $convert, 容許用戶在 aggregation pipeline 裏將文檔的字段轉換成統一的類型輸出,使得數據消費端,好比 MongoDB BI 工具、Spark Connectors 以及其餘 ETL 工具能更簡單的處理 MongoDB 數據。code
非阻塞的備節點讀(Non-Blocking Secondary Reads)
爲了確保備節點上的讀與主節點保持相同的因果一致性語義,MongoDB 備節點在批量應用 oplog 的時候會阻塞讀請求,這使得在高寫入負載下,備節點上讀的平均延時一般比主節點更高。
藉助事務功能中 storage engine timestamps and snapshots 的實現,引擎層能夠很容易的實現「指定時間戳快照讀取的功能」,使得備節點上的讀請求無需阻塞等待就能讀到一致時間點的數據。這個特性將極大的提高 MongoDB 讀擴展的能力。
遷移速度提高40%(40% Faster Data Migrations)
應用在不斷演進過程當中,其負載特性也在不斷髮生變化,這就要求數據庫具有擴展的能力,及時適應應用的負載變化。MongoDB 分片集羣支持實時的添加、移除shard 節點,並能在各個 shard 之間自動遷移數據來均衡負載。
MongoDB 4.0 支持在遷移數據的過程當中,併發的讀取(源端)和寫入(目標端),使得遷移的性能提高了約 40%, 使得新添加的節點能更快的承載業務壓力,讓分片集羣發揮最佳效果。
擴展修改訂閱(Extensions to Change Streams)
MongoDB 3.6 推出了修改訂閱( Change Streams)的功能,使得用戶能實時的獲取數據的修改,同時經過 Change Streams 還能很方便的實現多數據中心跨複製集的數據同步。MongoDB 4.0 進一步擴展 Change Streams 功能,能夠實現分片集羣維度的修改訂閱。