ShareMemory

時間 2019-11-21

標籤 sharememory 简体版

原文原文鏈接

項目地址： https://github.com/kelin-xycs/ShareMemoryhtml

ShareMemory

一個用 C# 實現的 No Sql 數據庫，也能夠說是分佈式緩存，用於做爲集羣的共享內存git

ShareMemory 是一個用 C# 實現的 No Sql 數據庫，也能夠說是分佈式緩存，用於做爲集羣的共享內存。github

構建集羣的關鍵是共享內存。 ShareMemory 能夠做爲集羣的共享內存，幫助構建集羣，這是 ShareMemory 的第一設計目標。數據庫

事實上，在過去的十幾年間，利用分佈式緩存來做爲共享內存構建 Web 集羣，已經成爲事實上的作法。數組

ShareMemory 設計目標中支持的集羣包含 Web 集羣，分佈式並行計算集羣等。緩存

ShareMemory 支持 2 種數據結構：字典（Dictionary）隊列（Queue）。安全

支持 6 大類數據類型： Value Type ， string ， Simple Object ， Value Type 數組， string 數組， Simple Object 數組。服務器

能夠將這 6 大類數據類型存放到 ShareMemory 。數據結構

Simple Object 是指屬性（Property）和字段（Field）類型是 Value Type ， string 的對象，簡單的說，不支持對象嵌套。這部分會在下面序列化的部分詳細介紹。多線程

ShareMemory 提供的數據操做都是原子操做，是線程安全的。

解決方案中包含 6 個項目：

Client ：用於 Demo 的 Client

Server ：用於 Demo 的 Server

ShareMemory ： ShareMemory 核心庫，用於 Server 端

ShareMemory.Client ： ShareMemory 客戶端庫，用於 Client 端

ShareMemory.Serialization ： ShareMemory 序列化庫，用於序列化

Test ：用於測試 ShareMemory.Serialization 的測試項目

ShareMemory 服務器端在 App.config 中配置字典和隊列，在 AppSettings 中經過「ShareMemory.Dics」和「ShareMemory.Queues」 2 個 key 來配置字典和隊列，如

add key="ShareMemory.Dics" value="Dic1, Dic2, Dic3"

add key="ShareMemory.Queues" value="Queue1, Queue2, Queue3"

Dic1 Dic2 Dic3 表示要建立的字典， Queue1 Queue2 Queue3 表示要建立的隊列，字典名隊列名之間用逗號「,」隔開。這樣 ShareMemory Host 在啓動時會建立 Dic1 Dic2 Dic3 3 個字典，和 Queue1 Queue2 Queue3 3 個隊列。

ShareMemory 客戶端經過 ShareMemory.Client 庫提供的 Helper 類， Dic 類， Q 類來訪問 ShareMemory 服務器端。

Helper類提供 GetDic() 方法，返回 Dic 對象。和 GetQ() 方法，返回 Q 對象。

Dic 提供 Set(key, value) 方法， Get(key) 方法， TryGet(key out value) 方法， Remove(key) 方法。 Set() 方法新增鍵值對或者修改鍵值對的值，若是鍵值對不存在，則新增鍵值對，若是鍵值對已存在，則更新值。 Get() 方法從 Dic 取得值，對於引用類型，若是鍵值對不存在，則返回 null 。 TryGet() 方法也是從 Dic 取得值，經過 out value 參數返回，若鍵值對不存在，則 Get() 方法返回值爲 false 。 TryGet() 方法是對 Value Type 設計的，由於 Value Type 不能根據返回值爲 null 來判斷鍵值對在 Dic 中是否存在。 Remove() 方法移除鍵值對，若是鍵值對不存在，也不會報錯。

Q 提供 En() 方法， De ， TryDe(out value) 方法。 En() 方法將對象放入隊列， De() 方法從隊列取出對象，對於引用類型，若返回 null ，表示隊列爲空。 TryDe() 方法也是從隊列取出對象，經過 out value 參數返回，若隊列爲空， TryDe() 方法返回值爲 false 。 TryDe() 方法是對 Value Type 設計的，由於 Value Type 不能根據返回值爲 null 來判斷隊列是否爲空。

接下來說明一下序列化的格式：

序列化由 ShareMemory.Serialization 項目完成，序列化格式是這樣的：

好比，有一個 Simple Object ，包含有 1 個 int A 屬性， 1 個 string B 字段， A = 2 , B = "Hello" ，那麼，序列化產生這樣一個字符串：

「o 1 A1 21 B5 Hello」

把這個字符串經過 Encoding.Utf8 轉成 byte 數組，就是序列化的結果了。

這個字符串的開頭是「o」，這表示 Simple Object 對象，後面跟着一個空格，空格後面的「1」表示接下來的數據長度是 1 個字符。這個數據就是後面的「A」，這表示 A 屬性的屬性名，「A」後面有一個「1」，這表示下一項的數據長度是 1 ，這個數據就是後面的「2」，這是 A 屬性的值，以此類推，「2」後面緊跟着的「1」是下一項的數據長度，這個數據就是「B」字符，這表示 B 屬性的屬性名，「B」後面的「5」表示下一項的數據長度，這個數據就是「Hello」。這樣就完成了對這個 Simple Object 的序列化。

你們能夠看到，對於 int 類型，序列化的方式是 ToString() ，對於 string ，就是 string 自己，實際上，目前除了 DateTime 外，其它的 Value Type 都是以 ToString() 的方式來序列化， DateTime 是取 Ticks 屬性，固然 string 就是 string 自己。

若是是單獨序列化一個 Value Type 的值，好比 int a = 2; 那麼就是「1 2」這樣一個字符串，如上所述，「1」表示數據長度，「2」表示數據值。

對於數組類型，舉個例子，假設有一個數組，放了 2 個 Simple Object 對象，這個 Simple Object 對象就是上面說的那個，那序列化後的字符串是這樣的：

「a 2 18 o 1 A1 21 B5 Hello18 o 1 A1 21 B5 Hello」

第一個字符「a」表示數組，這是固定的，後面跟一個空格，這也是固定的。空格後面是「2」，表示數組長度，即數組元素的個數。「2」後面跟一個空格，這也是固定的，空格後面是「18」，表示接下來的元素的長度，「18」後面跟一個空格，這也是固定的。空格以後就是元素的內容。這個內容，就是上面咱們講過的 Simple Object 序列化以後的字符串，這個字符串長度是 18 ，前面的「18」就是指這個。以此類推，第一個元素結束以後，又是一個「18」，這個 18 是指第二個元素的長度，「18」後面是空格，空格以後就是第二個元素序列化以後的字符串。

Value Type 數組， string 數組的原理都包含在上述裏了，就不具體舉例了。

總之， ShareMemory.Serialization 能夠支持 6 大類數據類型的序列化： Value Type ， string ， Simple Object ， Walue Type 數組， string 數組， Simple Object 數組。

能夠實際到項目裏運行看一下效果就比較清楚了。 ^ ^

ShareMemory.Serialization 只會序列化公有的屬性和字段，而且須要在要序列化的屬性和字段上加上 [ S ] 標記。

ShareMemory.Serialization 並不要求序列化方和反序列化方的對象定義在語法上徹底一致，好比序列化方的對象有一個 A 屬性，反序列化方能夠用一個 A 字段來接收 A 屬性的值，只要二者的名字相同就行。

ShareMemory.Serialization 能夠做爲一個序列化庫單獨使用。

ShareMemory 沒有提供對數據操做的鎖機制（Lock），由於對數據的鎖機制邏輯比較複雜。那麼，多個客戶端線程之間怎麼進行通訊協做呢？ ShareMemory 提供了與數據無關的鎖機制。 Helper類提供了 TryLock(lockName) 方法和 UnLock(lockName, lockId) 方法。 TryLock() 用來獲取鎖，參數 lockName 是鎖的名字，參與協做的線程間能夠約定一個鎖的名字來通訊。 TryLock() 方法的返回值是 lockId ，用來標識 1 次 Lock ，由於同一個名字的鎖可能會屢次 Lock 和 UnLock 。 UnLock 的時候須要傳入 lockId 參數。若是 TryLock() 方法返回的 lockId 是 null ，則表示未成功獲取鎖，客戶端可能須要再次 TryLock() 。

在分佈式系統中，由於一些緣由，可能會發生鎖沒有解鎖就被「遺棄」的狀況，好比發起鎖定的客戶端線程死掉或者掉線了，這樣就會形成「遺棄」的鎖。這個鎖就一直沒人解，就會形成其它線程一直等待而不能正常運行。爲了不這種問題， ShareMemory 規定鎖的有效時間是 1 分鐘，超過 1 分鐘的鎖會被系統自動解鎖。 ShareMemory 每 30 秒執行一次回收鎖的任務，因此實際中鎖的最大有效時間理論上大約是 1 分 30 秒。

這就是 ShareMemory 提供的鎖機制，能夠利用這個鎖機制來實現多個客戶端線程間的通訊協做。以此爲基礎，開發者還能夠實現各類豐富的線程間通訊協做方式。

關於鎖機制，能夠在 Client 項目中查看 Demo 。

接下來再來討論持久化水平擴展可用性數據不丟失性。

ShareMemory 不提供持久化。持久化仍然交給傳統的關係數據庫和文件系統。

ShareMemory 不提供水平擴展。水平擴展會帶來性能損耗。固然這不是多有理由的理由，啊哈哈。

ShareMemory 不提供可用性。開發者能夠本身想辦法解決，好比準備一臺備機。

ShareMemory 不提供數據不丟失性。 ShareMemory 至關於內存，因此不提供數據不丟失性。這好像也不是什麼理由，哈哈哈哈。

對於以上，咱們考慮過一些方案，比較簡單經典的方案是主從熱備，但在具體設計的時候，發現仍然有一些複雜的狀況。好比主從熱備，是同步備仍是異步備？同步備程序比較簡單，但會帶來性能損耗，對在用主機的響應時間產生影響。由於要把每一筆數據更新操做包含了主機和備機雙份的操做，主機備機 2 份操做合在一塊兒做爲一個操做。而且若是備機發生問題會反過來影響主機。

那麼異步備呢？異步備能夠把數據更新操做放到一個隊列（Queue）裏，而後由另外一個線程來逐一讀取隊列裏的操做對備機執行。但問題是順序的執行這些操做，這樣才能還原主機上的數據變化。這就致使不能多線程並行執行。這樣帶來的問題是，假如服務器的 CPU 是 4 核，若是更新很頻繁的話，那麼可能有 3 個核加入了更新的工做，熱備只有一個線程，最多隻能利用 1 個核，那麼更新記錄的增加會大於消費，那麼隊列裏的更新記錄會愈來愈多，堆積起來。把更新記錄寫到文件裏也沒用，文件也會增加。事實上， Sql Server 的 Always On 也存在 Log 膨脹的問題。

對於以上的問題，若是反過來， ShareMemory只提供一個內存模型，並不一刀切的負責可用性數據一致性數據完整性，另外一方面，開發者的程序本身實現如下 3 件事：

1 數據什麼時候持久化（哪些數據須要持久化），就像咱們編輯文檔會不按期隨時保存同樣

2 主機掛掉時，新的主機啓動時須要預先加載哪些數據，如經常使用數據，如 User Profile

3 一些重要數據的備份，好比按期不按期的數據同步快照

我想，這樣，事情就簡單了。

ShareMemory 提供讀寫數據的 API 便可。

ShareMemory 提供一個內存模型，持久化仍然交給傳統的關係數據庫文件系統等。

對於集羣負載均衡可用性數據完整性（不丟失性），咱們能夠參考 Windows NLB ， Windows 故障轉移集羣， Sql Server Log Shipping ， Sql Server Always On ，然鵝。

對於分佈式緩存分佈式消息的集羣可用性數據備份數據同步數據恢復，咱們能夠參考 Redis RabbitMQ ，然鵝。

根據網上的測評結果，固態硬盤的連續讀取速度能夠達到 1800M/s 以上（參考 http://ssd.zol.com.cn/608/6082302.html ）。咱們能夠來假想評估一個使用場景。好比，以門戶網站的場景爲例，假設有 100 萬人同時在線，用 ShareMemory 來存儲 User Profile 的話，假如每一個用戶的 User Profile 大小是 1 KB ，那麼， 100 萬個用戶的 User Profile 佔用的空間就是 1 G 。若是有 1 億個用戶的話，那佔用的空間就是 100 G 。在操做系統虛擬內存的支持下， 32 G 內存 + 120 G 固態硬盤應該會有不錯的表現。或者， 16 G 內存 + 120 G 固態硬盤， 8 G 內存 + 120 G 固態硬盤也許表現都會很好。

ShareMemory 的遠程通訊採用 MessageRPC 實現， MessageRPC 是我寫的另外一個項目： https://github.com/kelin-xycs/MessageRPC

相關標籤/搜索

sharememory

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。