上一篇文章《Docker Swarm 集羣管理利器核心概念掃盲》中咱們把 Swarm 重要的概念性知識給你們講解了一波,理論完事就該實戰了,這篇文章帶你們從零開始,搭建 Docker Swarm 集羣環境,並經過 Swarm 實現服務的彈性部署,滾動更新服務及回滾服務等功能。node
集羣搭建
環境準備
- 五臺安裝了 Docker 的 CentOS 機器,版本爲:
CentOS 7.8.2003
- Docker Engine 1.12+(最低要求 1.12,本文使用 19.03.12)
- 防火牆開啓如下端口或者關閉防火牆:
- TCP 端口 2377,用於集羣管理通訊;
- TCP 和 UDP 端口 7946,用於節點之間通訊;
- UDP 端口 4789,用於覆蓋網絡。
機器分佈
角色 | IP | HOSTNAME | Docker 版本 |
---|---|---|---|
Manager | 192.168.10.101 | manager1 | 19.03.12 |
Manager | 192.168.10.102 | manager2 | 19.03.12 |
Manager | 192.168.10.103 | manager3 | 19.03.12 |
Worker | 192.168.10.10 | worker1 | 19.03.12 |
Worker | 192.168.10.11 | worker2 | 19.03.12 |
- 能夠經過
hostname 主機名
修改機器的主機名(當即生效,重啓後失效); - 或者
hostnamectl set-hostname 主機名
修改機器的主機名(當即生效,重啓也生效); - 或者
vi /etc/hosts
編輯 hosts 文件,以下所示, 給 127.0.0.1 添加主機名(重啓生效)。
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 manager1 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
建立集羣
在任意節點下經過 docker swarm init
命令建立一個新的 Swarm 集羣並加入,且該節點會默認成爲 Manager 節點。根據咱們預先定義的角色,在 101 ~ 103 的任意一臺機器上運行該命令便可。linux
一般,第一個加入集羣的管理節點將成爲 Leader
,後來加入的管理節點都是 Reachable
。當前的 Leader 若是掛掉,全部的 Reachable 將從新選舉一個新的 Leader。nginx
[root@localhost ~]# docker swarm init --advertise-addr 192.168.10.101 Swarm initialized: current node (clumstpieg0qzzxt1caeazg8g) is now a manager. To add a worker to this swarm, run the following command: docker swarm join --token SWMTKN-1-5ob7jlej85qsygxubqypjuftiwruvew8e2cr4u3iuo4thxyrhg-3hbf2u3i1iagurdprl3n3yra1 192.168.10.101:2377 To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.
加入集羣
Docker 中內置的集羣模式自帶了公鑰基礎設施(PKI)系統,使得安所有署容器變得簡單。集羣中的節點使用傳輸層安全協議(TLS)對集羣中其餘節點的通訊進行身份驗證、受權和加密。redis
默認狀況下,經過 docker swarm init
命令建立一個新的 Swarm 集羣時,Manager 節點會生成新的根證書頒發機構(CA)和密鑰對,用於保護與加入羣集的其餘節點之間的通訊安全。docker
Manager 節點會生成兩個令牌,供其餘節點加入集羣時使用:一個 Worker 令牌,一個 Manager 令牌。每一個令牌都包括根 CA 證書的摘要和隨機生成的密鑰。當節點加入羣集時,加入的節點使用摘要來驗證來自遠程管理節點的根 CA 證書。遠程管理節點使用密鑰來確保加入的節點是批准的節點。shell
Manager
若要向該集羣添加 Manager 節點,管理節點先運行 docker swarm join-token manager
命令查看管理節點的令牌信息。安全
docker swarm join-token manager
而後在其餘節點上運行 docker swarm join
並攜帶令牌參數加入 Swarm 集羣,該節點角色爲 Manager。網絡
Worker
經過建立集羣時返回的結果能夠得知,要向這個集羣添加一個 Worker 節點,運行下圖中的命令便可。或者管理節點先運行 docker swarm join-token worker
命令查看工做節點的令牌信息。dom
而後在其餘節點上運行 docker swarm join
並攜帶令牌參數加入 Swarm 集羣,該節點角色爲 Worker。tcp
查看集羣信息
在任意 Manager 節點中運行 docker info
能夠查看當前集羣的信息。
查看集羣節點
在任意 Manager 節點中運行 docker node ls
能夠查看當前集羣節點信息。
docker node ls
*
表明當前節點,如今的環境爲 3 個管理節點構成 1 主 2 從,以及 2 個工做節點。
節點 MANAGER STATUS
說明:表示節點是屬於 Manager 仍是 Worker,沒有值則屬於 Worker 節點。
Leader
:該節點是管理節點中的主節點,負責該集羣的集羣管理和編排決策;Reachable
:該節點是管理節點中的從節點,若是 Leader 節點不可用,該節點有資格被選爲新的 Leader;Unavailable
:該管理節點已不能與其餘管理節點通訊。若是管理節點不可用,應該將新的管理節點加入羣集,或者將工做節點升級爲管理節點。
節點 AVAILABILITY
說明:表示調度程序是否能夠將任務分配給該節點。
Active
:調度程序能夠將任務分配給該節點;Pause
:調度程序不會將新任務分配給該節點,但現有任務仍能夠運行;Drain
:調度程序不會將新任務分配給該節點,而且會關閉該節點全部現有任務,並將它們調度在可用的節點上。
刪除節點
Manager
刪除節點以前須要先將該節點的 AVAILABILITY
改成 Drain
。其目的是爲了將該節點的服務遷移到其餘可用節點上,確保服務正常。最好檢查一下容器遷移狀況,確保這一步已經處理完成再繼續往下。
docker node update --availability drain 節點名稱|節點ID
而後,將該 Manager 節點進行降級處理,降級爲 Worker 節點。
docker node demote 節點名稱|節點ID
而後,在已經降級爲 Worker 的節點中運行如下命令,離開集羣。
docker swarm leave
最後,在管理節點中對剛纔離開的節點進行刪除。
docker node rm 節點名稱|節點ID
Worker
刪除節點以前須要先將該節點的 AVAILABILITY
改成 Drain
。其目的是爲了將該節點的服務遷移到其餘可用節點上,確保服務正常。最好檢查一下容器遷移狀況,確保這一步已經處理完成再繼續往下。
docker node update --availability drain 節點名稱|節點ID
而後,在準備刪除的 Worker 節點中運行如下命令,離開集羣。
docker swarm leave
最後,在管理節點中對剛纔離開的節點進行刪除。
docker node rm 節點名稱|節點ID
服務部署
注意:跟集羣管理有關的任何操做,都是在 Manager 節點上操做的。
建立服務
下面這個案例,使用 nginx 鏡像建立了一個名爲 mynginx 的服務,該服務會被隨機指派給一個工做節點運行。
docker service create --replicas 1 --name mynginx -p 80:80 nginx
docker service create
:建立服務;--replicas
:指定一個服務有幾個實例運行;--name
:服務名稱。
查看服務
能夠經過 docker service ls
查看運行的服務。
[root@manager1 ~]# docker service ls ID NAME MODE REPLICAS IMAGE PORTS hepx06k5ik5n mynginx replicated 1/1 nginx:latest *:80->80/tcp
能夠經過 docker service inspect 服務名稱|服務ID
查看服務的詳細信息。
[root@manager1 ~]# docker service inspect mynginx [ { "ID": "k0dbjg1zzy3l3g71kdwa56ect", "Version": { "Index": 127 }, "CreatedAt": "2020-09-16T10:05:55.627974095Z", "UpdatedAt": "2020-09-16T10:05:55.629507771Z", "Spec": { "Name": "mynginx", "Labels": {}, "TaskTemplate": { "ContainerSpec": { "Image": "nginx:latest@sha256:c628b67d21744fce822d22fdcc0389f6bd763daac23a6b77147d0712ea7102d0", "Init": false, "StopGracePeriod": 10000000000, "DNSConfig": {}, "Isolation": "default" }, "Resources": { "Limits": {}, "Reservations": {} }, "RestartPolicy": { "Condition": "any", "Delay": 5000000000, "MaxAttempts": 0 }, "Placement": { "Platforms": [ { "Architecture": "amd64", "OS": "linux" }, { "OS": "linux" }, { "OS": "linux" }, { "Architecture": "arm64", "OS": "linux" }, { "Architecture": "386", "OS": "linux" }, { "Architecture": "mips64le", "OS": "linux" }, { "Architecture": "ppc64le", "OS": "linux" }, { "Architecture": "s390x", "OS": "linux" } ] }, "ForceUpdate": 0, "Runtime": "container" }, "Mode": { "Replicated": { "Replicas": 1 } }, "UpdateConfig": { "Parallelism": 1, "FailureAction": "pause", "Monitor": 5000000000, "MaxFailureRatio": 0, "Order": "stop-first" }, "RollbackConfig": { "Parallelism": 1, "FailureAction": "pause", "Monitor": 5000000000, "MaxFailureRatio": 0, "Order": "stop-first" }, "EndpointSpec": { "Mode": "vip", "Ports": [ { "Protocol": "tcp", "TargetPort": 80, "PublishedPort": 80, "PublishMode": "ingress" } ] } }, "Endpoint": { "Spec": { "Mode": "vip", "Ports": [ { "Protocol": "tcp", "TargetPort": 80, "PublishedPort": 80, "PublishMode": "ingress" } ] }, "Ports": [ { "Protocol": "tcp", "TargetPort": 80, "PublishedPort": 80, "PublishMode": "ingress" } ], "VirtualIPs": [ { "NetworkID": "st2xiy7pjzap093wz4w4u6nbs", "Addr": "10.0.0.15/24" } ] } } ]
能夠經過 docker service ps 服務名稱|服務ID
查看服務運行在哪些節點上。
在對應的任務節點上運行 docker ps
能夠查看該服務對應容器的相關信息。
調用服務
接下來咱們測試一下服務是否能被正常訪問,而且該集羣下任意節點的 IP 地址都要能訪問到該服務才行。
測試結果:5 臺機器都可正常訪問到該服務。
彈性服務
將 service 部署到集羣之後,能夠經過命令彈性擴縮容 service 中的容器數量。在 service 中運行的容器被稱爲 task(任務)。
經過 docker service scale 服務名稱|服務ID=n
能夠將 service 運行的任務擴縮容爲 n 個。
經過 docker service update --replicas n 服務名稱|服務ID
也能夠達到擴縮容的效果。
將 mynginx service 運行的任務擴展爲 5 個:
[root@manager1 ~]# docker service scale mynginx=5 mynginx scaled to 5 overall progress: 5 out of 5 tasks 1/5: running [==================================================>] 2/5: running [==================================================>] 3/5: running [==================================================>] 4/5: running [==================================================>] 5/5: running [==================================================>] verify: Service converged
經過 docker service ps 服務名稱|服務ID
查看服務運行在哪些節點上。
咱們再來一波縮容的操做,命令以下:
[root@manager1 ~]# docker service update --replicas 3 mynginx mynginx overall progress: 3 out of 3 tasks 1/3: running [==================================================>] 2/3: running [==================================================>] 3/3: running [==================================================>] verify: Service converged
經過 docker service ps 服務名稱|服務ID
查看服務運行在哪些節點上。
在 Swarm 集羣模式下真正意義實現了所謂的彈性服務,動態擴縮容一行命令搞定,簡單、便捷、強大。
刪除服務
經過 docker service rm 服務名稱|服務ID
便可刪除服務。
[root@manager1 ~]# docker service rm mynginx mynginx [root@manager1 ~]# docker service ls ID NAME MODE REPLICAS IMAGE PORTS
滾動更新及回滾
如下案例將演示 Redis 版本如何滾動升級至更高版本再回滾至上一次的操做。
首先,建立 5 個 Redis 服務副本,版本爲 5,詳細命令以下:
# 建立 5 個副本,每次更新 2 個,更新間隔 10s,20% 任務失敗繼續執行,超出 20% 執行回滾,每次回滾 2 個 docker service create --replicas 5 --name redis \ --update-delay 10s \ --update-parallelism 2 \ --update-failure-action continue \ --rollback-monitor 20s \ --rollback-parallelism 2 \ --rollback-max-failure-ratio 0.2 \ redis:5
--update-delay
:定義滾動更新的時間間隔;--update-parallelism
:定義並行更新的副本數量,默認爲 1;--update-failure-action
:定義容器啓動失敗以後所執行的動做;--rollback-monitor
:定義回滾的監控時間;--rollback-parallelism
:定義並行回滾的副本數量;--rollback-max-failure-ratio
:任務失敗回滾比率,超過該比率執行回滾操做,0.2 表示 20%。
而後經過如下命令實現服務的滾動更新。
docker service update --image redis:6 redis
回滾服務,只能回滾到上一次操做的狀態,並不能連續回滾到指定操做。
docker service update --rollback redis
經常使用命令
docker swarm
命令 | 說明 |
---|---|
docker swarm init | 初始化集羣 |
docker swarm join-token worker | 查看工做節點的 token |
docker swarm join-token manager | 查看管理節點的 token |
docker swarm join | 加入集羣 |
docker node
命令 | 說明 |
---|---|
docker node ls | 查看集羣全部節點 |
docker node ps | 查看當前節點全部任務 |
docker node rm 節點名稱|節點ID | 刪除節點(-f 強制刪除) |
docker node inspect 節點名稱|節點ID | 查看節點詳情 |
docker node demote 節點名稱|節點ID | 節點降級,由管理節點降級爲工做節點 |
docker node promote 節點名稱|節點ID | 節點升級,由工做節點升級爲管理節點 |
docker node update 節點名稱|節點ID | 更新節點 |
docker service
命令 | 說明 |
---|---|
docker service create | 建立服務 |
docker service ls | 查看全部服務 |
docker service inspect 服務名稱|服務ID | 查看服務詳情 |
docker service logs 服務名稱|服務ID | 查看服務日誌 |
docker service rm 服務名稱|服務ID | 刪除服務(-f 強制刪除) |
docker service scale 服務名稱|服務ID=n | 設置服務數量 |
docker service update 服務名稱|服務ID | 更新服務 |
參考資料
- https://docs.docker.com/engine/swarm/swarm-tutorial/
- https://docs.docker.com/engine/swarm/swarm-mode/
- https://docs.docker.com/engine/swarm/how-swarm-mode-works/pki/
- https://docs.docker.com/engine/swarm/join-nodes/
- https://docs.docker.com/engine/swarm/swarm-tutorial/rolling-update/
本文采用 知識共享「署名-非商業性使用-禁止演繹 4.0 國際」許可協議
。
🤗 您的點贊
和轉發
是對我最大的支持。
📢 掃碼關注 哈嘍沃德先生
「文檔 + 視頻」每篇文章都配有專門視頻講解,學習更輕鬆噢 ~