memcached 是由 Danga Interactive 開發並使用 BSD 許可的一種通用的分佈式內存緩存系統。java
Danga Interactive 開發 memcached 的目的是建立一個內存緩存系統來處理其網站 LiveJournal.com 的巨大流量。天天超過 2000 萬的頁面訪問量給 LiveJournal 的數據庫施加了巨大的壓力,所以 Danga 的 Brad Fitzpatrick 便着手設計了 memcached。memcached 不只減小了網站數據庫的負載,還成爲現在世界上大多數高流量網站所使用的緩存解決方案。數據庫
本 文首先全面概述 memcached,而後指導您安裝 memcached 以及在開發環境中構建它。我還將介紹 memcached 客戶機命令(總共有 9 個)並展現如何在標準和高級 memcached 操做中使用它們。最後,我將提供一些使用 memcached 命令測量緩存的性能和效率的技巧。緩存
在開始安裝 和使用 using memcached 以前,咱們須要瞭解如何將 memcached 融入到您的環境中。雖然在任何地方均可以使用 memcached,但我發現須要在數據庫層中執行幾個常常性查詢時,memcached 每每能發揮最大的效用。我常常會在數據庫和應用服務器之間設置一系列 memcached 實例,並採用一種簡單的模式來讀取和寫入這些服務器。圖 1 能夠幫助您瞭解如何設置應用程序體系結構:服務器
體 繫結構至關容易理解。我創建了一個 Web 層,其中包括一些 Apache 實例。下一層是應用程序自己。這一層一般運行於 Apache Tomcat 或其餘開源應用服務器之上。再下面一層是配置 memcached 實例的地方 — 即應用服務器與數據庫服務器之間。在使用這種配置時,須要採用稍微不一樣的方式來執行數據庫的讀取和寫入操做。異步
我執行讀取操做的順序是從 Web 層獲取請求(須要執行一次數據庫查詢)並檢查以前在緩存中存儲的查詢結果。若是我找到所需的值,則返回它。若是未找到,則執行查詢並將結果存儲在緩存中,而後再將結果返回給 Web 層。分佈式
將數據寫入到數據庫中時,首先須要執行數據庫寫入操做,而後將以前緩存的任何受此寫入操做影響的結果設定爲無效。此過程有助於防止緩存和數據庫之間出現數據不一致性。memcached
memcached 支持一些操做系統,包括 Linux®、Windows®、Mac OS 和 Solaris。在本文中,我將詳細介紹如何經過源文件構建和安裝 memcached。採用這種方式的主要緣由是我在遇到問題時能夠查看源代碼。性能
libevent 是安裝 memcached 的惟一前提條件。它是 memcached 所依賴的異步事件通知庫。您能夠在 monkey.org 上找到關於 libevent 的源文件。接下來,找到其最新版本的源文件。對於本文,咱們使用穩定的 1.4.11 版本。獲取了歸檔文件以後,將它解壓到一個方便的位置,而後執行清單 1 中的命令:學習
cd libevent-1.4.11-stable/ ./configure make make install
從 Danga Interactive 獲取 memcached 源文件,仍然選擇最新的分發版。在撰寫本文時,其最新版本是 1.4.0。將 tar.gz 解壓到方便的位置,並執行清單 2 中的命令:網站
cd memcached-1.4.0/ ./configure make make install
完成這些步驟以後,您應該安裝了一個 memcached 工做副本,而且可使用它了。讓咱們進行簡單介紹,而後使用它。
要開始使用 memcached,您首先須要啓動 memcached 服務器,而後使用 telnet 客戶機鏈接到它。
要啓動 memcached,執行清單 3 中的命令:
./memcached -d -m 2048 -l 10.0.0.40 -p 11211
這會以守護程序的形式啓動 memcached(-d
),爲其分配 2GB 內存(-m 2048
),並指定監聽 localhost,即端口 11211。您能夠根據須要修改這些值,但以上設置足以完成本文中的練習。接下來,您須要鏈接到 memcached。您將使用一個簡單的 telnet 客戶機鏈接到 memcached 服務器。
大多數操做系統都提供了內置的 telnet 客戶機,但若是您使用的是基於 Windows 的操做系統,則須要下載第三方客戶機。我推薦使用 PuTTy。
安裝了 telnet 客戶機以後,執行清單 4 中的命令:
telnet localhost 11211
若是一切正常,則應該獲得一個 telnet 響應,它會指示 Connected to localhost(已經鏈接到 localhost)。若是未得到此響應,則應該返回以前的步驟並確保 libevent 和 memcached 的源文件都已成功生成。
您現現已經登陸到 memcached 服務器。此後,您將可以經過一系列簡單的命令來與 memcached 通訊。9 個 memcached 客戶端命令能夠分爲三類:
您將使用五種基本 memcached 命令執行最簡單的操做。這些命令和操做包括:
set
add
replace
get
delete
前三個命令是用於操做存儲在 memcached 中的鍵值對的標準修改命令。它們都很是簡單易用,且都使用清單 5 所示的語法:
command <key> <flags> <expiration time> <bytes> <value>
表 1 定義了 memcached 修改命令的參數和用法。
參數 | 用法 |
---|---|
key | key 用於查找緩存值 |
flags | 能夠包括鍵值對的整型參數,客戶機使用它存儲關於鍵值對的額外信息 |
expiration time | 在緩存中保存鍵值對的時間長度(以秒爲單位,0 表示永遠) |
bytes | 在緩存中存儲的字節點 |
value | 存儲的值(始終位於第二行) |
如今,咱們來看看這些命令的實際使用。
setset
命令用於向緩存添加新的鍵值對。若是鍵已經存在,則以前的值將被替換。
注意如下交互,它使用了 set
命令:
set userId 0 0 5 12345 STORED
若是使用 set
命令正確設定了鍵值對,服務器將使用單詞 STORED 進行響應。本示例向緩存中添加了一個鍵值對,其鍵爲 userId
,其值爲 12345
。並將過時時間設置爲 0,這將向 memcached 通知您但願將此值存儲在緩存中直到刪除它爲止。
add
僅當緩存中不存在鍵時,add
命令纔會向緩存中添加一個鍵值對。若是緩存中已經存在鍵,則以前的值將仍然保持相同,而且您將得到響應 NOT_STORED。
下面是使用 add
命令的標準交互:
set userId 0 0 5 12345 STORED add userId 0 0 5 55555 NOT_STORED add companyId 0 0 3 564 STORED
replace
僅當鍵已經存在時,replace
命令纔會替換緩存中的鍵。若是緩存中不存在鍵,那麼您將從 memcached 服務器接受到一條 NOT_STORED 響應。
下面是使用 replace
命令的標準交互:
replace accountId 0 0 5 67890 NOT_STORED set accountId 0 0 5 67890 STORED replace accountId 0 0 5 55555 STORED
最後兩個基本命令是 get
和 delete
。這些命令至關容易理解,而且使用了相似的語法,以下所示:
command <key>
接下來看這些命令的應用。
getget
命令用於檢索與以前添加的鍵值對相關的值。您將使用 get
執行大多數檢索操做。
下面是使用 get
命令的典型交互:
set userId 0 0 5 12345 STORED get userId VALUE userId 0 5 12345 END get bob END
如您所見,get
命令至關簡單。您使用一個鍵來調用 get
,若是這個鍵存在於緩存中,則返回相應的值。若是不存在,則不返回任何內容。
delete
最後一個基本命令是 delete
。delete
命令用於刪除 memcached 中的任何現有值。您將使用一個鍵調用 delete
,若是該鍵存在於緩存中,則刪除該值。若是不存在,則返回一條 NOT_FOUND 消息。
下面是使用 delete
命令的客戶機服務器交互:
set userId 0 0 5 98765 STORED delete bob NOT_FOUND delete userId DELETED get userId END
能夠在 memcached 中使用的兩個高級命令是 gets
和 cas
。gets
和 cas
命令須要結合使用。您將使用這兩個命令來確保不會將現有的名稱/值對設置爲新值(若是該值已經更新過)。咱們來分別看看這些命令。
getsgets
命令的功能相似於基本的 get
命令。兩個命令之間的差別在於,gets
返回的信息稍微多一些:64 位的整型值很是像名稱/值對的 「版本」 標識符。
下面是使用 gets
命令的客戶機服務器交互:
set userId 0 0 5 12345 STORED get userId VALUE userId 0 5 12345 END gets userId VALUE userId 0 5 4 12345 END
考慮 get
和 gets
命令之間的差別。gets
命令將返回一個額外的值 — 在本例中是整型值 4,用於標識名稱/值對。若是對此名稱/值對執行另外一個 set
命令,則 gets
返回的額外值將會發生更改,以代表名稱/值對已經被更新。清單 6 顯示了一個例子:
set userId 0 0 5 33333 STORED gets userId VALUE userId 0 5 5 33333 END
您看到 gets
返回的值了嗎?它已經更新爲 5。您每次修更名稱/值對時,該值都會發生更改。
cascas
(check 和 set)是一個很是便捷的 memcached 命令,用於設置名稱/值對的值(若是該名稱/值對在您上次執行 gets
後沒有更新過)。它使用與 set
命令相相似的語法,但包括一個額外的值:gets
返回的額外值。
注意如下使用 cas
命令的交互:
set userId 0 0 5 55555 STORED gets userId VALUE userId 0 5 6 55555 END cas userId 0 0 5 6 33333 STORED
如您所見,我使用額外的整型值 6 來調用 gets
命令,而且操做運行很是順序。如今,咱們來看看清單 7 中的一系列命令:
cas
命令set userId 0 0 5 55555 STORED gets userId VALUE userId 0 5 8 55555 END cas userId 0 0 5 6 33333 EXISTS
注意,我並未使用 gets
最近返回的整型值,而且 cas
命令返回 EXISTS 值以示失敗。從本質上說,同時使用 gets
和 cas
命令能夠防止您使用自上次讀取後通過更新的名稱/值對。
最後兩個 memcached 命令用於監控和清理 memcached 實例。它們是 stats
和 flush_all
命令。
statsstats
命令的功能正如其名:轉儲所鏈接的 memcached 實例的當前統計數據。在下例中,執行 stats
命令顯示了關於當前 memcached 實例的信息:
stats STAT pid 63 STAT uptime 101758 STAT time 1248643186 STAT version 1.4.11 STAT pointer_size 32 STAT rusage_user 1.177192 STAT rusage_system 2.365370 STAT curr_items 2 STAT total_items 8 STAT bytes 119 STAT curr_connections 6 STAT total_connections 7 STAT connection_structures 7 STAT cmd_get 12 STAT cmd_set 12 STAT get_hits 12 STAT get_misses 0 STAT evictions 0 STAT bytes_read 471 STAT bytes_written 535 STAT limit_maxbytes 67108864 STAT threads 4 END
此處的大多數輸出都很是容易理解。稍後在討論緩存性能時,我還將詳細解釋這些值的含義。至於目前,咱們先來看看輸出,而後再使用新的鍵來運行一些 set
命令,並再次運行 stats
命令,注意發生了哪些變化。
flush_allflush_all
是最後一個要介紹的命令。這個最簡單的命令僅用於清理緩存中的全部名稱/值對。若是您須要將緩存重置到乾淨的狀態,則 flush_all
能提供很大的用處。下面是一個使用 flush_all
的例子:
set userId 0 0 5 55555 STORED get userId VALUE userId 0 5 55555 END flush_all OK get userId END
在本文的最後,我將討論如何使用高級 memcached 命令來肯定緩存的性能。stats
命令用於調優緩存的使用。須要注意的兩個最重要的統計數據是 et_hits 和 get_misses。這兩個值分別指示找到名稱/值對的次數(get_hits)和未找到名稱/值對的次數(get_misses)。
結 合這些值,咱們能夠肯定緩存的利用率如何。初次啓動緩存時,能夠看到 get_misses 會天然地增長,但在通過必定的使用量以後,這些 get_misses 值應該會逐漸趨於平穩 — 這表示緩存主要用於常見的讀取操做。若是您看到 get_misses 繼續快速增長,而 get_hits 逐漸趨於平穩,則須要肯定一下所緩存的內容是什麼。您可能緩存了錯誤的內容。
肯定緩存效率的另外一種方法是查看緩存的命中率(hit ratio)。緩存命中率表示執行 get
的次數與錯過 get
的次數的百分比。要肯定這個百分比,須要再次運行 stats
命令,如清單 8 所示:
stats STAT pid 6825 STAT uptime 540692 STAT time 1249252262 STAT version 1.2.6 STAT pointer_size 32 STAT rusage_user 0.056003 STAT rusage_system 0.180011 STAT curr_items 595 STAT total_items 961 STAT bytes 4587415 STAT curr_connections 3 STAT total_connections 22 STAT connection_structures 4 STAT cmd_get 2688 STAT cmd_set 961 STAT get_hits 1908 STAT get_misses 780 STAT evictions 0 STAT bytes_read 5770762 STAT bytes_written 7421373 STAT limit_maxbytes 536870912 STAT threads 1 END
如今,用 get_hits 的數值除以 cmd_gets。在本例中,您的命中率大約是 71%。在理想狀況下,您可能但願獲得更高的百分比 — 比率越高越好。查看統計數據並不時測量它們能夠很好地斷定緩存策略的效率。
緩存是任何海量 Web 應用程序不可或缺的部分。我本身成功使用過它好幾回。若是您選擇使用 memcached 做爲緩存解決方案,那麼我敢保證您能夠看到它的效率如何。
在 本系列的第 2 部分中,您將學習如何將 memcached 集成到一個 Grails 應用程序中。咱們將藉此機會討論一個激動人心的用於可伸縮 Web 應用程序開發的棧,並應用一些出色的技巧。到目前爲止,本文介紹的知識足以幫助您開始掌握 memcached。我鼓勵您安裝本身的 memcached 實例並開始嘗試使用它。