SequoiaDB監控與開發實踐分析

時間 2020-07-06

標籤 sequoiadb 監控開發實踐分析简体版

原文原文鏈接

使用背景node

公司近期上線了一個新應用，底層數據庫採用了國產的分佈式數據庫 – SequoiaDB。git

由於須要將 SequoiaDB 集羣歸入到公司的整個監控體系中，因此須要對 SequoiaDB 的狀態、性能指標等信息收集起來，而後提供監控系統使用。github

SequoiaDB 數據庫自己提供了一個圖形化的監控界面 – SAC，可是裏面的監控項，和咱們公司過去經常使用的指標有很大出入。因此在諮詢了 SequoiaDB 的相關人員後，決定本身開發一套監控程序。sql

SequoiaDB 存儲引擎的監控數據庫

在 SequoiaDB 數據庫，存在兩個大的體系，一個是計算層，像咱們就是使用了 MySQL 實例，另一個就是 SequoiaDB 的分佈式存儲層，也是整個數據庫對性能影響最大的部分。小程序

關於 MySQL 的監控，公司原本就已經存在一整套完備的監控程序，因此這塊就不須要再額外的開發了。可是對於 SequoiaDB 底層的分佈式，仍是很是有必要將相關指標收集起來的。api

SequoiaDB 在監控體系上，其實作得仍是比較完整的，只是在展示方式上，還須要再打磨一下。SequoiaDB 底層分佈式的全部運行信息，用戶均可以經過snapshot，或者是list 命令獲取。session

我從 SequoiaDB 的技術人員中瞭解到，其實像 SAC，或者 sdbtop 等這種 SequoiaDB 官方提供的監控工具，實際上也是基於 snapshot 和 list 命令開發。你們能夠經過查閱官網信息中心瞭解更多的方法說明，snapshot 方法介紹和 list 方法介紹。運維

2.1 SequoiaDB 的快照說明分佈式

在 SequoiaDB 存儲引擎中，若是你要查看運行情況，能夠經過快照來獲取信息。

SequoiaDB 的快照命令很是簡答，若是使用它提供的 sdb 客戶端，能夠這麼來執行，例如查看整個集羣中，每一個 table 的使用狀況：

> db.snapshot(SDB_SNAP_COLLECTIONS)
{
  "Name": "foo.bar",
  "UniqueID": 4294967297,
  "Details": [
    {
      "GroupName": "group1",
      "Group": [
        {
          "ID": 0,
          "LogicalID": 0,
          "Sequence": 1,
          "Indexes": 1,
          "Status": "Normal",
          "TotalRecords": 1,
          "TotalDataPages": 1,
          "TotalIndexPages": 2,
          "TotalLobPages": 0,
          "TotalDataFreeSpace": 65432,
          "TotalIndexFreeSpace": 65486,
          "TotalDataRead": 1,
          "TotalIndexRead": 0,
          "TotalDataWrite": 1,
          "TotalIndexWrite": 1,
          "TotalUpdate": 0,
          "TotalDelete": 0,
          "TotalInsert": 1,
          "TotalSelect": 1,
          "TotalRead": 1,
          "TotalWrite": 1,
          "TotalTbScan": 1,
          "TotalIxScan": 0,
          "ResetTimestamp": "2020-05-26-13.42.20.163109",
          "NodeName": "datanode:11820"
        }
      ]
    }
  ]
}

你們從返回的結果就可以瞭解，首先 SequoiaDB 的分佈式存儲引擎，在獲取快照時，它返回的結果格式爲 JSON ，這個和咱們過去使用 Oracle 或者 MySQL 數據很是的不一樣，可能有一些朋友在開始時不大適應。可是當你習慣了JSON 的靈活結構後，你會打開一片新的大陸。

我給你們演示的例子中，是查詢整個集羣表級的快照信息。它可以讓你們清晰地瞭解每一個table 在各個 group 上的分佈，以及它對應的數據讀，索引讀這類關鍵信息的瞬時絕對值。固然，若是你們直接這麼查看信息，估計你們眼睛都要看瞎，因此在後續的工具跟進上，SequoiaDB 數據庫還須要多多努力的。

2.2 SequoiaDB SQL 快速處理

若是你們已經在使用SequoiaDB 存儲引擎提供的 snapshot 和 list 功能了，那麼你是否也發現了一個問題，sdb 客戶端提供的 api 命令，執行起來的計算能力實在太弱了，例如我要關聯把 SDB_SNAP_SESSIONS 快照(http://doc.sequoiadb.com/cn/s..._id-1479173713-edition_id-304)和 SDB_SNAP_TRANSACTIONS 快照(http://doc.sequoiadb.com/cn/s..._id-1479173720-edition_id-304) 關聯起來，查看當前 SequoiaDB 存儲引擎中，到底有哪些事務在等待鎖。這個時候，單純使用 api 就會痛苦萬分，由於要本身手工編寫一個關聯程序。我相信大部分的 DBA 朋友都會懷念那些單純使用 SQL 命令的時光。

經過本身不斷的努力（翻官網信息中心），終於找到了一種優雅的方式來解決，就是 sql 語法的監控視圖（http://doc.sequoiadb.com/cn/sequoiadb-cat_id-1559546719-edition_id-304))。

例如剛纔的提出的問題，就能夠經過這個 sql 命令獲取信息：

> db.exec("select trans.NodeName as node, session.LastOpType as lastOpType, session.LastOpInfo as lastOpInfo from $SNAPSHOT_TRANS as trans inner join $SNAPSHOT_SESSION as session on trans.RelatedID = session.RelatedID where trans.WaitLock.CSID is not null ")
{
  "node": "datanode:11820",
  "lastOpType": "GETMORE",
  "lastOpInfo": "ContextID:297, NumToRead:-1"
}
{
  "node": "datanode:11820",
  "lastOpType": "UPDATE",
  "lastOpInfo": ""
}

SequoiaDB 存儲引擎中這個簡易版的 SQL 語法解析，對於平常的操做和運維監控來講，已經達到了事半功倍的效果了。

2.3 開發語言選擇

SequoiaDB 存儲引擎，支持多種開發語言獲取引擎的監控信息，包括常見的：Java、PHP、Python、C++、C等等。你們在開發時，能夠在 SequoiaDB 官網中下載對應的驅動包，在開發和編譯時，將 SequoiaDB 的驅動包加入到 ClassPath 就能夠了。

對於我我的來講，雖然 Java 很香，可是我仍是選擇了 REST 接口做爲個人程序與 SequoiaDB 引擎的交互方式。REST 接口雖然不像 Driver 驅動使用那麼便利，可是它勝在脫離語言與環境的要求，我能夠在任何地方調用它，而且得到的結果都是同樣的。

引玉拋磚引玉的Demo程序

爲了給你們演示，我基於 SequoiaDB 提供的 REST 接口，使用 Python 語言作了一個可以實時監控 SequoiaDB 中某張表的數據讀、寫狀況的小程序，算是回饋 SequoiaDB 社區的小貢獻。

程序的源碼能夠從：

https://github.com/yuki0703/Demo

Github項目中獲取。

程序的邏輯很是簡單，就是經過 SequoiaDB 提供的 REST 接口，經過 SequoiaDB 的 SQL 語法中的監控視圖方法，獲取某張表的快照信息，而後經過計算1秒之內的數值差距，得出該表每秒鐘所執行數據操做。

程序的 help 信息以下：

SequoiaDB Monitor

optional arguments:
  -h, --help   show this help message and exit
  --host HOST  coord host
  -u USERNAME  username
  -p PASSWORD  password
  -t TABLE     table name

監控 SequoiaDB 某張表的效果以下：