「Flink」RocksDB介紹以及Flink對RocksDB的支持

RocksDB介紹

RocksDB簡介

RocksDB是基於C++語言編寫的嵌入式KV存儲引擎,它不是一個分佈式的DB,而是一個高效、高性能、單點的數據庫引擎。它是由Facebook基於Google開源的kv存儲LevelDB開發開發。RocksDB使用LSM存儲引擎。它針對不一樣的生產環境進行調優,能夠直接使用內存、也能夠使用Flash、或者用硬盤或者HDFS。並且支持不一樣的壓縮算法,有一整套的工具用於生產、調試使用。RocksDB是一種嵌入式、KV型、持久化的存儲。html

使用嵌入式的數據存儲緣由有不少,當數據頻繁訪問內存、或者存儲時,網絡延遲會增長響應時間。java

RocksDB的主要應用場景

  1. 適應於多CPU場景
    • 通常的商業服務器有不少的CPU核,例如:志強E5系列 - 6核
    • RocksDB能夠高效運行在多核服務器上
    • 它提供的RocksDB語義比傳統DBMS更簡單
  2. 高效利用存儲
    • RocksDB能夠在快速存儲上高效運行且不會成爲性能瓶頸
    • RocksDB採用LSM引擎,對比B-Tree引擎,它有更好的壓縮和更小的寫放大
  3. 彈性架構,支持擴展
  4. 支持IO-bound、in-memory、write-once

入門案例

爲了簡單說明RocksDB,咱們這裏使用RocksDB的Java版原本編寫。算法

導入Maven依賴

<dependencies>
        <!-- https://mvnrepository.com/artifact/org.rocksdb/rocksdbjni -->
        <dependency>
            <groupId>org.rocksdb</groupId>
            <artifactId>rocksdbjni</artifactId>
            <version>5.11.3</version>
        </dependency>
    </dependencies>

基於RocksDB讀寫數據

public class GettingStartDemo {
    // 由於RocksDB是由C++編寫的,在Java中使用首先須要加載Native庫
    static {
        // Loads the necessary library files.
        // Calling this method twice will have no effect.
        // By default the method extracts the shared library for loading at
        // java.io.tmpdir, however, you can override this temporary location by
        // setting the environment variable ROCKSDB_SHAREDLIB_DIR.
        // 默認這個方法會加壓一個共享庫到java.io.tmpdir
        RocksDB.loadLibrary();
    }

    public static void main(String[] args) throws RocksDBException {
        // 1. 打開數據庫
        // 1.1 建立數據庫配置
        Options dbOpt = new Options();
        // 1.2 配置當數據庫不存在時自動建立
        dbOpt.setCreateIfMissing(true);
        // 1.3 打開數據庫。由於RocksDB默認是保存在本地磁盤,因此須要指定位置
        RocksDB rdb = RocksDB.open(dbOpt, "./data/rocksdb");

        // 2. 寫入數據
        // 2.1 RocksDB都是以字節流的方式寫入數據庫中,因此咱們須要將字符串轉換爲字節流再寫入。這點相似於HBase
        byte[] key = "zhangsan".getBytes();
        byte[] value = "20".getBytes();

        // 2.2 調用put方法寫入數據
        rdb.put(key, value);
        System.out.println("寫入數據到RocksDB完成!");

        // 3. 調用delete方法讀取數據
        System.out.println("從RocksDB讀取key = " + new String(key) + "的value爲" + new String(rdb.get(key)));

        // 4. 移除數據
        rdb.delete(key);

        // 關閉資源
        rdb.close();
        dbOpt.close();
    }
}

運行程序後,咱們能夠發現,在data/rocksdb文件夾中,生成了一下幾個文件:數據庫

image

  • 0000004.sst
    • sst是RocksDB的數據存儲文件,是二進制格式的
  • 0000006.log
    • log是預寫日誌文件,LSM架構引擎都是有預寫日誌的
  • CURRENT
    • CURRENT文件是一個文本文件,記錄最近的MANIFEST
  • IDENTITY
    • 存放當前rocksdb的惟一標識
  • LOCK
    • LOCK 進程的全局鎖,DB一旦被open, 其餘進程將沒法修改
  • LOG
    • rocksdb的操做日誌文件, 可配置按期的統計信息寫入LOG. 可經過info_log_level調整日誌輸出級別; 經過keep_log_file_num限制文件數量 等等。
  • LOG.old.15807….
  • MANIFECT-000005
    • 記錄rocksdb最近的狀態變化日誌。其中包含manifest日誌 和最新的文件指針
  • OPTIONS-000005
    • rocksdb的配置文件
  • OPTIONS-000008

Flink使用RocksDBBackend

一、導入Maven依賴apache

<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-statebackend-rocksdb_2.11</artifactId>
<version>1.9.0</version>
</dependency>

二、配置啓用RocksDBBackend服務器

// 此處也能夠是HDFS路徑,這裏爲了測試方便,因此使用的是本地路徑
env.setStateBackend(new RocksDBStateBackend("file:///D:/project/java8/data/rocksdb", true));



參考文獻:網絡

RocksDB中文網:https://rocksdb.org.cn/架構

https://rocksdb.org.cn/doc/RocksJava-Basics.html分佈式

https://www.jianshu.com/p/2638e2b379c3ide

https://www.jianshu.com/p/3302be5542c7

相關文章
相關標籤/搜索