安裝和使用 memcached

memcached 是由 Danga Interactive 開發並使用 BSD 許可的一種通用的分佈式內存緩存系統。java

Danga Interactive 開發 memcached 的目的是建立一個內存緩存系統來處理其網站 LiveJournal.com 的巨大流量。天天超過 2000 萬的頁面訪問量給 LiveJournal 的數據庫施加了巨大的壓力,所以 Danga 的 Brad Fitzpatrick 便着手設計了 memcached。memcached 不只減小了網站數據庫的負載,還成爲現在世界上大多數高流量網站所使用的緩存解決方案。數據庫

本 文首先全面概述 memcached,而後指導您安裝 memcached 以及在開發環境中構建它。我還將介紹 memcached 客戶機命令(總共有 9 個)並展現如何在標準和高級 memcached 操做中使用它們。最後,我將提供一些使用 memcached 命令測量緩存的性能和效率的技巧。緩存

如何將 memcached 融入到您的環境中?

在開始安裝 和使用 using memcached 以前,咱們須要瞭解如何將 memcached 融入到您的環境中。雖然在任何地方均可以使用 memcached,但我發現須要在數據庫層中執行幾個常常性查詢時,memcached 每每能發揮最大的效用。我常常會在數據庫和應用服務器之間設置一系列 memcached 實例,並採用一種簡單的模式來讀取和寫入這些服務器。圖 1 能夠幫助您瞭解如何設置應用程序體系結構:服務器

圖 1. 使用 memcached 的示例應用程序體系結構

使用 memcached 的示例應用程序體系結構

體 繫結構至關容易理解。我創建了一個 Web 層,其中包括一些 Apache 實例。下一層是應用程序自己。這一層一般運行於 Apache Tomcat 或其餘開源應用服務器之上。再下面一層是配置 memcached 實例的地方 — 即應用服務器與數據庫服務器之間。在使用這種配置時,須要採用稍微不一樣的方式來執行數據庫的讀取和寫入操做。異步

讀取

我執行讀取操做的順序是從 Web 層獲取請求(須要執行一次數據庫查詢)並檢查以前在緩存中存儲的查詢結果。若是我找到所需的值,則返回它。若是未找到,則執行查詢並將結果存儲在緩存中,而後再將結果返回給 Web 層。分佈式

寫入

將數據寫入到數據庫中時,首先須要執行數據庫寫入操做,而後將以前緩存的任何受此寫入操做影響的結果設定爲無效。此過程有助於防止緩存和數據庫之間出現數據不一致性。memcached

安裝 memcached

memcached 支持一些操做系統,包括 Linux®、Windows®、Mac OS 和 Solaris。在本文中,我將詳細介紹如何經過源文件構建和安裝 memcached。採用這種方式的主要緣由是我在遇到問題時能夠查看源代碼。性能

libevent

libevent 是安裝 memcached 的惟一前提條件。它是 memcached 所依賴的異步事件通知庫。您能夠在 monkey.org 上找到關於 libevent 的源文件。接下來,找到其最新版本的源文件。對於本文,咱們使用穩定的 1.4.11 版本。獲取了歸檔文件以後,將它解壓到一個方便的位置,而後執行清單 1 中的命令:學習

清單 1. 生成和安裝 libevent
cd libevent-1.4.11-stable/

./configure
			
make
				
make install

memcached

Danga Interactive 獲取 memcached 源文件,仍然選擇最新的分發版。在撰寫本文時,其最新版本是 1.4.0。將 tar.gz 解壓到方便的位置,並執行清單 2 中的命令:網站

清單 2. 生成和安裝 memcached
cd memcached-1.4.0/

./configure
			
make
				
make install

完成這些步驟以後,您應該安裝了一個 memcached 工做副本,而且可使用它了。讓咱們進行簡單介紹,而後使用它。

使用 memcached

要開始使用 memcached,您首先須要啓動 memcached 服務器,而後使用 telnet 客戶機鏈接到它。

要啓動 memcached,執行清單 3 中的命令:

清單 3. 啓動 memcached
./memcached -d -m 2048 -l 10.0.0.40 -p 11211

這會以守護程序的形式啓動 memcached(-d),爲其分配 2GB 內存(-m 2048),並指定監聽 localhost,即端口 11211。您能夠根據須要修改這些值,但以上設置足以完成本文中的練習。接下來,您須要鏈接到 memcached。您將使用一個簡單的 telnet 客戶機鏈接到 memcached 服務器。

大多數操做系統都提供了內置的 telnet 客戶機,但若是您使用的是基於 Windows 的操做系統,則須要下載第三方客戶機。我推薦使用 PuTTy

安裝了 telnet 客戶機以後,執行清單 4 中的命令:

清單 4. 鏈接到 memcached
telnet localhost 11211

若是一切正常,則應該獲得一個 telnet 響應,它會指示 Connected to localhost(已經鏈接到 localhost)。若是未得到此響應,則應該返回以前的步驟並確保 libevent 和 memcached 的源文件都已成功生成。

您現現已經登陸到 memcached 服務器。此後,您將可以經過一系列簡單的命令來與 memcached 通訊。9 個 memcached 客戶端命令能夠分爲三類:

  • 基本
  • 高級
  • 管理

基本 memcached 客戶機命令

您將使用五種基本 memcached 命令執行最簡單的操做。這些命令和操做包括:

  • set
  • add
  • replace
  • get
  • delete

前三個命令是用於操做存儲在 memcached 中的鍵值對的標準修改命令。它們都很是簡單易用,且都使用清單 5 所示的語法:

清單 5. 修改命令語法
command <key> <flags> <expiration time> <bytes>
<value>

表 1 定義了 memcached 修改命令的參數和用法。

表 1. memcached 修改命令參數
參數 用法
key key 用於查找緩存值
flags 能夠包括鍵值對的整型參數,客戶機使用它存儲關於鍵值對的額外信息
expiration time 在緩存中保存鍵值對的時間長度(以秒爲單位,0 表示永遠)
bytes 在緩存中存儲的字節點
value 存儲的值(始終位於第二行)

如今,咱們來看看這些命令的實際使用。

set
set 命令用於向緩存添加新的鍵值對。若是鍵已經存在,則以前的值將被替換。

注意如下交互,它使用了 set 命令:

set userId 0 0 5
12345
STORED

若是使用 set 命令正確設定了鍵值對,服務器將使用單詞 STORED 進行響應。本示例向緩存中添加了一個鍵值對,其鍵爲 userId,其值爲 12345。並將過時時間設置爲 0,這將向 memcached 通知您但願將此值存儲在緩存中直到刪除它爲止。

add
僅當緩存中不存在鍵時,add 命令纔會向緩存中添加一個鍵值對。若是緩存中已經存在鍵,則以前的值將仍然保持相同,而且您將得到響應 NOT_STORED

下面是使用 add 命令的標準交互:

set userId 0 0 5
12345
STORED

add userId 0 0 5
55555
NOT_STORED

add companyId 0 0 3
564
STORED

replace
僅當鍵已經存在時,replace 命令纔會替換緩存中的鍵。若是緩存中不存在鍵,那麼您將從 memcached 服務器接受到一條 NOT_STORED 響應。

下面是使用 replace 命令的標準交互:

replace accountId 0 0 5
67890
NOT_STORED

set accountId 0 0 5
67890
STORED

replace accountId 0 0 5
55555
STORED

最後兩個基本命令是 getdelete。這些命令至關容易理解,而且使用了相似的語法,以下所示:

command <key>

接下來看這些命令的應用。

get
get 命令用於檢索與以前添加的鍵值對相關的值。您將使用 get 執行大多數檢索操做。

下面是使用 get 命令的典型交互:

set userId 0 0 5
12345
STORED

get userId
VALUE userId 0 5
12345
END

get bob
END

如您所見,get 命令至關簡單。您使用一個鍵來調用 get,若是這個鍵存在於緩存中,則返回相應的值。若是不存在,則不返回任何內容。

delete
最後一個基本命令是 deletedelete 命令用於刪除 memcached 中的任何現有值。您將使用一個鍵調用 delete,若是該鍵存在於緩存中,則刪除該值。若是不存在,則返回一條 NOT_FOUND 消息。

下面是使用 delete 命令的客戶機服務器交互:

set userId 0 0 5
98765
STORED

delete bob
NOT_FOUND

delete userId
DELETED

get userId
END

高級 memcached 客戶機命令

能夠在 memcached 中使用的兩個高級命令是 getscasgetscas 命令須要結合使用。您將使用這兩個命令來確保不會將現有的名稱/值對設置爲新值(若是該值已經更新過)。咱們來分別看看這些命令。

gets
gets 命令的功能相似於基本的 get 命令。兩個命令之間的差別在於,gets 返回的信息稍微多一些:64 位的整型值很是像名稱/值對的 「版本」 標識符。

下面是使用 gets 命令的客戶機服務器交互:

set userId 0 0 5
12345
STORED

get userId
VALUE userId 0 5
12345
END

gets userId
VALUE userId 0 5 4
12345
END

考慮 getgets 命令之間的差別。gets 命令將返回一個額外的值 — 在本例中是整型值 4,用於標識名稱/值對。若是對此名稱/值對執行另外一個 set 命令,則 gets 返回的額外值將會發生更改,以代表名稱/值對已經被更新。清單 6 顯示了一個例子:

清單 6. set 更新版本指示符
set userId 0 0 5
33333
STORED

gets userId
VALUE userId 0 5 5
33333
END

您看到 gets 返回的值了嗎?它已經更新爲 5。您每次修更名稱/值對時,該值都會發生更改。

cas
cas(check 和 set)是一個很是便捷的 memcached 命令,用於設置名稱/值對的值(若是該名稱/值對在您上次執行 gets 後沒有更新過)。它使用與 set 命令相相似的語法,但包括一個額外的值:gets 返回的額外值。

注意如下使用 cas 命令的交互:

set userId 0 0 5
55555
STORED

gets userId
VALUE userId 0 5 6
55555
END

cas userId 0 0 5 6
33333
STORED

如您所見,我使用額外的整型值 6 來調用 gets 命令,而且操做運行很是順序。如今,咱們來看看清單 7 中的一系列命令:

清單 7. 使用舊版本指示符的 cas 命令
set userId 0 0 5
55555
STORED

gets userId
VALUE userId 0 5 8
55555
END

cas userId 0 0 5 6
33333
EXISTS

注意,我並未使用 gets 最近返回的整型值,而且 cas 命令返回 EXISTS 值以示失敗。從本質上說,同時使用 getscas 命令能夠防止您使用自上次讀取後通過更新的名稱/值對。

緩存管理命令

最後兩個 memcached 命令用於監控和清理 memcached 實例。它們是 statsflush_all 命令。

stats
stats 命令的功能正如其名:轉儲所鏈接的 memcached 實例的當前統計數據。在下例中,執行 stats 命令顯示了關於當前 memcached 實例的信息:

stats
STAT pid 63
STAT uptime 101758
STAT time 1248643186
STAT version 1.4.11
STAT pointer_size 32
STAT rusage_user 1.177192
STAT rusage_system 2.365370
STAT curr_items 2
STAT total_items 8
STAT bytes 119
STAT curr_connections 6
STAT total_connections 7
STAT connection_structures 7
STAT cmd_get 12
STAT cmd_set 12
STAT get_hits 12
STAT get_misses 0
STAT evictions 0
STAT bytes_read 471
STAT bytes_written 535
STAT limit_maxbytes 67108864
STAT threads 4
END

此處的大多數輸出都很是容易理解。稍後在討論緩存性能時,我還將詳細解釋這些值的含義。至於目前,咱們先來看看輸出,而後再使用新的鍵來運行一些 set 命令,並再次運行 stats 命令,注意發生了哪些變化。

flush_all
flush_all 是最後一個要介紹的命令。這個最簡單的命令僅用於清理緩存中的全部名稱/值對。若是您須要將緩存重置到乾淨的狀態,則 flush_all 能提供很大的用處。下面是一個使用 flush_all 的例子:

set userId 0 0 5
55555
STORED

get userId
VALUE userId 0 5
55555
END

flush_all
OK

get userId
END

緩存性能

在本文的最後,我將討論如何使用高級 memcached 命令來肯定緩存的性能。stats 命令用於調優緩存的使用。須要注意的兩個最重要的統計數據是 et_hits 和 get_misses。這兩個值分別指示找到名稱/值對的次數(get_hits)和未找到名稱/值對的次數(get_misses)。

結 合這些值,咱們能夠肯定緩存的利用率如何。初次啓動緩存時,能夠看到 get_misses 會天然地增長,但在通過必定的使用量以後,這些 get_misses 值應該會逐漸趨於平穩 — 這表示緩存主要用於常見的讀取操做。若是您看到 get_misses 繼續快速增長,而 get_hits 逐漸趨於平穩,則須要肯定一下所緩存的內容是什麼。您可能緩存了錯誤的內容。

肯定緩存效率的另外一種方法是查看緩存的命中率(hit ratio)。緩存命中率表示執行 get 的次數與錯過 get 的次數的百分比。要肯定這個百分比,須要再次運行 stats 命令,如清單 8 所示:

清單 8. 計算緩存命中率
stats
STAT pid 6825
STAT uptime 540692
STAT time 1249252262
STAT version 1.2.6
STAT pointer_size 32
STAT rusage_user 0.056003
STAT rusage_system 0.180011
STAT curr_items 595
STAT total_items 961
STAT bytes 4587415
STAT curr_connections 3
STAT total_connections 22
STAT connection_structures 4
STAT cmd_get 2688
STAT cmd_set 961
STAT get_hits 1908
STAT get_misses 780
STAT evictions 0
STAT bytes_read 5770762
STAT bytes_written 7421373
STAT limit_maxbytes 536870912
STAT threads 1
END

如今,用 get_hits 的數值除以 cmd_gets。在本例中,您的命中率大約是 71%。在理想狀況下,您可能但願獲得更高的百分比 — 比率越高越好。查看統計數據並不時測量它們能夠很好地斷定緩存策略的效率。

結束語

緩存是任何海量 Web 應用程序不可或缺的部分。我本身成功使用過它好幾回。若是您選擇使用 memcached 做爲緩存解決方案,那麼我敢保證您能夠看到它的效率如何。

在 本系列的第 2 部分中,您將學習如何將 memcached 集成到一個 Grails 應用程序中。咱們將藉此機會討論一個激動人心的用於可伸縮 Web 應用程序開發的棧,並應用一些出色的技巧。到目前爲止,本文介紹的知識足以幫助您開始掌握 memcached。我鼓勵您安裝本身的 memcached 實例並開始嘗試使用它。

相關文章
相關標籤/搜索