Redis 存儲對象信息是用 Hash 仍是 String

Redis 內部使用一個 RedisObject 對象來表示全部的 key 和 value,RedisObject 中的 type,則是表明一個 value 對象具體是何種數據類型,它包含字符串(String)、鏈表(List)、哈希結構(Hash)、集合(Set)、有序集合(Sorted set)。html

平常工做中咱們存儲對象信息的時候,通常有兩種作法,一種是用 Hash 存儲,另外一種是 String 存儲。但好像並無所謂的最佳實踐,那麼實際上到底用什麼數據結構存儲更好呢?數據庫

首先簡單回顧下,Redis 的 Hash 和 String 結構。編程

String

String 數據結構是簡單的 key-value 類型,value 其實不只是 String,也能夠是數字。Redis 中的 String 能夠表示不少語義:數組

  • 字符串(bits)
  • 整數
  • 浮點數

這三種類型,Redis 會根據具體的場景完成自動轉換,而且根據須要選取底層的承載方式。String 在Redis 內部存儲默認就是一個字符串,被 RedisObject 所引用,當遇到 incr、decr 等操做時會轉成數值型進行計算,此時 RedisObject 的 encoding 字段爲int。緩存

在存儲過程當中,咱們能夠將用戶信息使用 Json 序列化成字符串,而後將序列化後的字符串存入 Redis 進行緩存。網絡

String 數據結構

因爲 Redis 的字符串是動態字符串,能夠修改,內部結構相似於 Java 的 ArrayList,採用預分配冗餘空間的方式來減小內存的頻繁分配。如上圖所示,內部爲當前字符串實際分配的空間 capacity,通常高於實際字符串長度 len。數據結構

假設咱們要存儲的結構是:async

{
  "name": "xiaowang",
  "age": "35"
}

若是此時將此用戶信息的 name 改成「xiaoli」,再存到 Redis 中,Redis 是不須要從新分配空間的。並且咱們在讀取和存儲數據的時候只須要對作 Json 序列化與反序列化,比較方便。編程語言

Hash

Hash 在不少編程語言中都有着很普遍的應用,而在 Redis 中也是如此。在 Redis 中,Hash 經常用來緩存一些對象信息,如用戶信息、商品信息、配置信息等,所以也被稱爲字典(dictionary),Redis 的字典使用 Hash table 做爲底層實現, 一個 Hash table 裏面能夠有多個哈希表節點,而每一個哈希表節點保存了字典中的一個鍵值對。實際上,Redis 數據庫底層也是採用 Hash table 來存儲鍵值對的。工具

Redis 的 Hash 至關於 Java 的 HashMap,內部結構實現與 HashMap 一致,即數組+鏈表結構。只是 reHash 方式不同。

Hash 數據結構

前面說到 String 適合存儲用戶信息,而 Hash 結構也能夠存儲用戶信息,不過是對每一個字段單獨存儲,所以能夠在查詢時獲取部分字段的信息,節省網絡流量。不過 Redis 的 Hash 的值只能是字符串,存儲上面的那個例子還好,若是存儲的用戶信息變爲:

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那麼該如何存儲"clothes"屬性又變成了該用 String 仍是 Hash 的問題。

String 和 Hash 佔用內存的比較

既然兩種數據結構均可以存儲結構體信息。到底哪一種更加合適呢?

首先咱們用代碼先插入 10000 條數據,而後用可視化工具來看看內存的佔用狀況。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0:

再來看看 Redis1:

能夠看到仍是有點差距的,可是差距並不明顯。

網友討論

網上的用戶也有一樣的疑問, 由於值的長度是不肯定的,因此不知道採用 String 仍是 Hash 存儲更有效率。

截圖來源於 StackOverflow(Redis Strings vs Redis Hashes to represent Json: efficiency?)

這裏我主要給你們翻譯下該問題下優質的答案:

適合用 String 存儲的狀況:

  • 每次須要訪問大量的字段
  • 存儲的結構具備多層嵌套的時候

適合用 Hash 存儲的狀況:

  • 在大多數狀況中只須要訪問少許字段
  • 本身始終知道哪些字段可用,防止使用 mget 時獲取不到想要的數據

總結

本文主要介紹了Redis 存儲對象信息是用 Hash 仍是 String,建議是大部分狀況下使用 String 存儲就好,畢竟在存儲具備多層嵌套的對象時方便不少,佔用的空間也比 Hash 小。當咱們須要存儲一個特別大的對象時,並且在大多數狀況中只須要訪問該對象少許的字段時,能夠考慮使用 Hash。

推薦閱讀

Flink 在又拍雲日誌批處理中的實踐

相關文章
相關標籤/搜索