Docker文件系統實戰

關鍵詞:Docker 聯合文件系統 鏡像 容器 雲信私有化html

在本文中,咱們來實戰構建一個Docker鏡像,而後實例化容器,在Docker的生命週期中詳細分析一下Docker的文件存儲狀況和DockerFile優化策略。linux

1.png

在開始實戰以前,咱們先介紹一個概念,聯合文件系統(Union File System)。聯合文件系統是實現Docker鏡像的技術基礎,支持對文件系統的修改做爲一次提交來一層層的疊加,同時能夠將不一樣目錄掛載到同一個虛擬文件系統下。鏡像的分層存儲和繼承就是基於此特性實現。json

下面是Docker官方的一張描述文件系統的圖片,顯示了一張聯合文件系統在串聯鏡像層和容器層起到的做用緩存

2.jpg

Docker支持多種聯合文件系統,常見的有aufs,deviceMapper,overlay,overlay2,本文章中使用的系統版本爲debian9.1,Docker版本爲17.06.2-ce,默認使用是overlay2。bash

看到這裏若是你已經對Docker文件系統有了簡單的概念,那麼讓咱們開始實戰,來對分層文件系統的存儲方式進行更加深刻的瞭解。網絡

鏡像層

這是一個雲信私有化項目中基於debian系統鏡像建立的jdk8基礎鏡像,爲了方便閱讀和分析,咱們Dockerfile進行了一些精簡,只保留核心部份內容app

FROM hub.c.163.com/library/debian:stretch
MAINTAINER nim
#下載jdk
ADD http://10.173.11.100/nim/jdk-8u202-linux-x64.tar.gz /usr/local/nim/
#解壓jdk並刪除
RUN tar -xzvf /usr/local/nim/jdk-8u202-linux-x64.tar.gz -C /usr/local/nim/ \\
&& rm /usr/local/nim/jdk-8u202-linux-x64.tar.gz
#設置環境變量
ENV JAVA\_HOME=/usr/local/nim/jdk1.8.0\_202
ENV PATH=$JAVA\_HOME/bin:$PATH
CMD \["/bin/bash"\]

根據構建鏡像,查看構建結果,原基礎鏡像100M,構建後鏡像體積697M。運維

3.png

鏡像存儲curl

如今開始看一下構建鏡像工做在文件層存儲狀況。首先咱們使用Docker history查看一下剛剛構建鏡像狀況,能夠看到基礎鏡像佔用100M,兩個鏡像分層佔用194MB和403M。優化

4.png

接下來咱們看查看一下文件系統中的存儲狀況,本環境使用overlay2,Docker鏡像層存儲默認路徑爲/var/lib/Docker/overlay2/,能夠看到鏡像存儲目錄下有4個目錄,其中110M的對應是基礎鏡像,另外兩個爲ADD JDK(186M)和解壓JDK壓縮包的鏡像分層(389M)。

5.png

其中的l目錄包含了全部層的軟鏈接,軟連接使用短名稱,避免mount時候參數達到頁面大小限制。

6.png

下面咱們瞭解一下,每一個分層中的文件內容。基礎鏡像分層包含diff文件夾和link文件,diff文件夾中存放當前分層內容,link文件記錄短名稱。

7.png

接下來看一下COPY JDK生成的內容,diff文件夾保存了jdk壓縮包,本層相比基礎鏡像層,多了lower,merged,work三個文件/文件夾,其中lower記錄了此層的下層ID(基礎鏡像層),merged目錄做爲提供了統一視圖,在容器層讀寫層被使用,work目錄用於聯合掛載指定的工做目錄,使用過程對用戶不可見。

8.png

解壓JDK層的文件夾結構內容和上一層相似,主要關注jdk壓縮包占用空間爲0,表示已被刪除。

9.png

如今來重點關注一個問題,鏡像大小等於全部分層相加,在後續分層中被刪除的jdk壓縮包仍然要佔用存儲空間,這並非咱們本來意圖,所以這裏就出現了鏡像文件進行優化的點。優化後的Dockerfile以下

FROM hub.c.163.com/library/debian:stretch
MAINTAINER nim
RUN curl -o /usr/local/nim/jdk-8u202-linux-x64.tar.gz http://10.173.11.100/nim/jdk-8u202-linux-x64.tar.gz \\
&& tar -xzvf /usr/local/nim/jdk-8u202-linux-x64.tar.gz -C /usr/local/nim/ \\
&& rm /usr/local/nim/jdk-8u202-linux-x64.tar.gz \\
&& export JAVA\_HOME=/usr/local/nim/jdk1.8.0\_202 \\
&& export PATH=$JAVA\_HOME/bin:$PATH
CMD \["/bin/bash"\]

借這個優化後的內容,咱們再談一下構建Docker鏡像時在時間和空間可優化的點

  1. 組合運行語句:合併相同類型構建語句,能夠有效減小鏡像分層;
  2. 利用鏡像構建緩存:時間同步,基礎軟件安裝等固定內容在鏡像前部分處理,鏡像從新構建時會使用緩存,節省時間;
  3. 清理中間產物:注意安裝過程當中使用的軟件和壓縮包在必定要同一層裏清理,不然仍然會佔用鏡像空間;
  4. 構建語句優化:好比ADD在處理本地文件時能夠直接解壓縮,起到COPY + RUN tar的做用;
  5. 優化基礎鏡像源:國內高校和大型IT企業都有建立鏡像站,選擇一個穩定更新及時的鏡像站能夠有效縮短構建時間;

舉例的鏡像中優化策略涉及1,3條,用curl替代add,與解壓和刪除合併爲一層,Dockerfile減小了層數,清理中間過程的jdk安裝包,下圖是優化後鏡像體積變化:

10.png

構建鏡像真的是層數越少越好嗎?固然不是這麼絕對,尤爲在早期鏡像版本不是很穩定或是後續迭代比較頻繁時,合理的鏡像分層會減小編譯時間,下降出錯機率,也可讓Dockerfile更具備可讀性。能夠再穩定版本造成以後對鏡像進行二次優化。

鏡像元數據

分析一個鏡像元數據咱們主要關注三個目錄

/var/lib/Docker/image/overlay2/imaged/
/var/lib/Docker/image/overlay2/layerdb/
/var/lib/Docker/overlay2/

第一個目錄保存鏡像基礎元數據,第二個目錄保存鏡像分層元數據,第三個是上文提到的分層存儲目錄,保存實際分層內容。下面就根據實際狀況來看一下,元數據與存儲信息是如何關聯起來的。

Docker鏡像的基本信息保存在/var/lib/Docker/image/overlay2/imaged/content/sha256/下面,能夠根據Docker image ID在此目錄下查找到對應ID開頭文件。此文件中以json的形式保存了該鏡像的分層文件系統、構建信息、相關容器等內容。

11.png

第二個目錄/var/lib/Docker/image/overlay2/layerdb/sha256/保存分層元數據,每個分層元數據目錄下有cache-id,diff,size信息,其中cache-id對應分層存儲層,diff關聯鏡像基礎元數據信息。

12.png

13.png

14.png

容器層

首先咱們來啓動一個容器,掛載宿主機/opt/yunxin目錄到容器/usr/local/yunxin目錄

15.png

建立容器完成以後,在鏡像存儲目錄/var/lib/Docker/overlay2/會生成容器的初始層和讀寫層,二者使用相同標識,初始層後面多了-init。初始層中主要保存初始化容器環境時,與容器相關的環境信息,如容器主機名,主機host信息以及域名服務文件等;讀寫層用於容器的讀寫,Docker容器內的進程只對讀寫層擁有寫權限,而對其餘層文件內容只擁有讀權限

16.png

接下來咱們進入容器操做進行一系列操做,再根據結果分析一下讀寫層對於文件的保存和處理,下面是操做和對應結果以及讀寫層實際文件存儲狀況。

序號 類  型 操    做 表 現
1 寫入新文件 寫入/root/container_file.txt 寫入讀寫層
2 掛載目錄寫入新文件 寫入/usr/local/yunxin/mount_file.txt 不寫入讀寫層,僅保存在掛載目錄
3 修改鏡像原有文件 修改/usr/local/nim/jdk1.8.0_202/THIRDPARTYLICENSEREADME.txt 寫入讀寫層
4 刪除鏡像原有文件 刪除/usr/local/nim/jdk1.8.0_202/README.html 保存在讀寫層

17.png

讀寫層中的merged文件夾提供了統一視圖,面向用戶展現聯合文件系統掛載完成的最終形態。

18.png

接下來咱們再基於同一個鏡像啓動幾個容器實例,而後來查詢一下Docker容器使用空間,只有第一個容器因爲上面修改文件只佔用154k,新啓動的容器並無額外佔用空間。可見基於同一個鏡像建立容器時,全部的容器共享鏡像層內容,有效節約了空間。讀寫層只保存修改內容,若是是操做鏡像層文件,Docker採用的是修改時複製策略(copy-on-write)。這時回頭再看一下第一節出現的兩張圖,會對Docker的文件系統有了更深的體會。

19.png

結語

Docker 鏡像和容器文件系統相關知識在雲信私有化產品的鏡像管理和運維存儲管理方面做出理論支撐,但這只是深刻了解Docker的開始。隨着時間的積澱和雲信旗下IM、音視頻、點播以及衆多相關產品私有化工做的深刻,更多的模塊和鏡像,更多的客戶和需求,更復雜的網絡和環境都逐漸呈如今咱們面前。Docker做爲構建雲信私有化服務的基礎,只有更深刻的去了解原理才能在使用中去更好的優化產品和開展運維。但願咱們能爲用戶提供更可靠的雲信私有化服務,也但願能在後續的文章中能與你們分享更多關於Docker的知識。

當即瞭解網易雲信私有云>>

更多技術乾貨,歡迎關注vx公衆號網易智慧企業技術+」。系列課程提早看,精品禮物免費得,還可直接對話CTO。

聽網易CTO講述前沿觀察,看最有價值技術乾貨,學網易最新實踐經驗。網易智慧企業技術+,陪你從思考者成長爲技術專家。

相關文章
相關標籤/搜索