Redis 存儲對象信息是用 Hash 仍是 String

時間 2021-05-20

標籤 html 數據庫編程數組緩存網絡數據結構 async 編程語言工具欄目 Redis 简体版

原文原文鏈接

Redis 內部使用一個 RedisObject 對象來表示全部的 key 和 value，RedisObject 中的 type，則是表明一個 value 對象具體是何種數據類型，它包含字符串（String）、鏈表（List）、哈希結構（Hash）、集合（Set）、有序集合（Sorted set）。html

平常工做中咱們存儲對象信息的時候，通常有兩種作法，一種是用 Hash 存儲，另外一種是 String 存儲。但好像並無所謂的最佳實踐，那麼實際上到底用什麼數據結構存儲更好呢？數據庫

首先簡單回顧下，Redis 的 Hash 和 String 結構。編程

String

String 數據結構是簡單的 key-value 類型，value 其實不只是 String，也能夠是數字。Redis 中的 String 能夠表示不少語義：數組

字符串（bits）
整數
浮點數

這三種類型，Redis 會根據具體的場景完成自動轉換，而且根據須要選取底層的承載方式。String 在Redis 內部存儲默認就是一個字符串，被 RedisObject 所引用，當遇到 incr、decr 等操做時會轉成數值型進行計算，此時 RedisObject 的 encoding 字段爲int。緩存

在存儲過程當中，咱們能夠將用戶信息使用 Json 序列化成字符串，而後將序列化後的字符串存入 Redis 進行緩存。網絡

因爲 Redis 的字符串是動態字符串，能夠修改，內部結構相似於 Java 的 ArrayList，採用預分配冗餘空間的方式來減小內存的頻繁分配。如上圖所示，內部爲當前字符串實際分配的空間 capacity，通常高於實際字符串長度 len。數據結構

假設咱們要存儲的結構是：async

{
  "name": "xiaowang",
  "age": "35"
}

若是此時將此用戶信息的 name 改成「xiaoli」，再存到 Redis 中，Redis 是不須要從新分配空間的。並且咱們在讀取和存儲數據的時候只須要對作 Json 序列化與反序列化，比較方便。編程語言

Hash

Hash 在不少編程語言中都有着很普遍的應用，而在 Redis 中也是如此。在 Redis 中，Hash 經常用來緩存一些對象信息，如用戶信息、商品信息、配置信息等，所以也被稱爲字典（dictionary），Redis 的字典使用 Hash table 做爲底層實現，一個 Hash table 裏面能夠有多個哈希表節點，而每一個哈希表節點保存了字典中的一個鍵值對。實際上，Redis 數據庫底層也是採用 Hash table 來存儲鍵值對的。工具

Redis 的 Hash 至關於 Java 的 HashMap，內部結構實現與 HashMap 一致，即數組+鏈表結構。只是 reHash 方式不同。

前面說到 String 適合存儲用戶信息，而 Hash 結構也能夠存儲用戶信息，不過是對每一個字段單獨存儲，所以能夠在查詢時獲取部分字段的信息，節省網絡流量。不過 Redis 的 Hash 的值只能是字符串，存儲上面的那個例子還好，若是存儲的用戶信息變爲：

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那麼該如何存儲"clothes"屬性又變成了該用 String 仍是 Hash 的問題。

String 和 Hash 佔用內存的比較

既然兩種數據結構均可以存儲結構體信息。到底哪一種更加合適呢？

首先咱們用代碼先插入 10000 條數據，而後用可視化工具來看看內存的佔用狀況。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0：

再來看看 Redis1：

能夠看到仍是有點差距的，可是差距並不明顯。

網友討論

網上的用戶也有一樣的疑問，由於值的長度是不肯定的，因此不知道採用 String 仍是 Hash 存儲更有效率。

這裏我主要給你們翻譯下該問題下優質的答案：

適合用 String 存儲的狀況：

每次須要訪問大量的字段
存儲的結構具備多層嵌套的時候

適合用 Hash 存儲的狀況：

在大多數狀況中只須要訪問少許字段
本身始終知道哪些字段可用，防止使用 mget 時獲取不到想要的數據

總結

本文主要介紹了Redis 存儲對象信息是用 Hash 仍是 String，建議是大部分狀況下使用 String 存儲就好，畢竟在存儲具備多層嵌套的對象時方便不少，佔用的空間也比 Hash 小。當咱們須要存儲一個特別大的對象時，並且在大多數狀況中只須要訪問該對象少許的字段時，能夠考慮使用 Hash。

Redis 存儲對象信息是用 Hash 仍是 String

String

Hash

String 和 Hash 佔用內存的比較

網友討論

總結

推薦閱讀