k8s全棧監控之metrics-server和prometheus

時間 2019-11-09

標籤 k8s 監控 metrics server prometheus 简体版

原文原文鏈接

1、概述html

使用metric-server收集數據給k8s集羣內使用，如kubectl,hpa,scheduler等
使用prometheus-operator部署prometheus，存儲監控數據
使用kube-state-metrics收集k8s集羣內資源對象數據
使用node_exporter收集集羣中各節點的數據
使用prometheus收集apiserver，scheduler，controller-manager，kubelet組件數據
使用alertmanager實現監控報警
使用grafana實現數據可視化

一、部署metrics-servernode

git  clone  https://github.com/cuishuaigit/k8s-monitor.git
 cd k8s-monitor

我都是把這種服務部署在master節點上面，此時須要修改metrics-server-deployment.yamlgit

--- apiVersion: v1 kind: ServiceAccount metadata: name: metrics-server namespace: kube-system --- apiVersion: extensions/v1beta1 kind: Deployment metadata: name: metrics-server namespace: kube-system labels: k8s-app: metrics-server spec: selector: matchLabels: k8s-app: metrics-server template: metadata: name: metrics-server labels: k8s-app: metrics-server spec: serviceAccountName: metrics-server tolerations: - effect: NoSchedule key: node.kubernetes.io/unschedulable operator: Exists - key: NoSchedule operator: Exists effect: NoSchedule volumes: # mount in tmp so we can safely use from-scratch images and/or read-only containers - name: tmp-dir emptyDir: {} containers: - name: metrics-server image: k8s.gcr.io/metrics-server-amd64:v0.3.1 imagePullPolicy: Always command: - /metrics-server - --kubelet-insecure-tls - --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP volumeMounts: - name: tmp-dir mountPath: /tmp nodeSelector: metrics: "yes"

爲master節點添加labelgithub

kubectl label nodes ku  metrics=yes

部署api

kubectl create -f metrics-server/deploy/1.8+/

驗證：bash

it's coolapp

注：metrics-server默認使用node的主機名，可是coredns裏面沒有物理機主機名的解析，一種是部署的時候添加一個參數：tcp

- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIPui

第二種是使用dnsmasq構建一個上游的dns服務，參照https://www.cnblogs.com/cuishuai/p/9856843.html。spa

二、部署prometheus

下載相關文件：

前面部署metrics-server已經把全部的文件pull到本地了，因此直接使用
cd k8s-monitor

1.搭建nfs服務動態提供持久化存儲

1.安裝nfs sudo apt-get install -y nfs-kernel-server sudo apt-get install -y nfs-common sudo vi /etc/exports /data/opv *(rw,sync,no_root_squash,no_subtree_check) 注意將*換成本身的ip段，純內網的話也能夠用*，代替任意 sudo /etc/init.d/rpcbind restart sudo /etc/init.d/nfs-kernel-server restart sudo systemctl enable rpcbind nfs-kernel-server 客戶端掛在使用 sudo apt-get install -y nfs-common mount -t nfs ku13-1:/data/opv /data/opv -o proto=tcp -o nolock 爲了方便使用將上面的mount命令直接放到.bashrc裏面 2.建立namesapce kubectl creaet -f nfs/monitoring-namepsace.yaml 3.爲nfs建立rbac kubectl create -f nfs/rbac.yaml 4.建立deployment，將nfs的地址換成本身的 kubectl create -f nfs/nfs-deployment.yaml 5.建立storageclass kubectl create -f nfs/storageClass.yaml

2.安裝Prometheus

cd k8s-monitor/Promutheus/prometheus

1.建立權限 kubectl create -f rbac.yaml 2.建立 node-exporter kubectl create -f prometheus-node-exporter-daemonset.yaml kubectl create -f prometheus-node-exporter-service.yaml 3.建立 kube-state-metrics kubectl create -f kube-state-metrics-deployment.yaml kubectl create -f kube-state-metrics-service.yaml 4.建立 node-directory-size-metrics kubectl create -f node-directory-size-metrics-daemonset.yaml 5.建立 prometheus kubectl create -f prometheus-pvc.yaml kubectl create -f prometheus-core-configmap.yaml kubectl create -f prometheus-core-deployment.yaml kubectl create -f prometheus-core-service.yaml kubectl create -f prometheus-rules-configmap.yaml 6.修改core-configmap裏的etcd地址

3.安裝Grafana

cd k8s-monitor/Promutheus/grafana

1.安裝grafana service kubectl create -f grafana-svc.yaml 2.建立configmap kubectl create -f grafana-configmap.yaml 3.建立pvc kubectl create -f grafana-pvc.yaml 4.建立gragana deployment kubectl create -f grafana-deployment.yaml 5.建立dashboard configmap kubectl create configmap "grafana-import-dashboards" --from-file=dashboards/ --namespace=monitoring 6.建立job，導入dashboard等數據 kubectl create -f grafana-job.yaml

查看部署：

prometheus和grafana都是採用的nodePort方式暴漏的服務，因此能夠直接訪問。

grafana默認的用戶名密碼：admin/admin

QA：

一、集羣是使用kubeadm部署的，controller-manager和schedule都是監聽的127.0.0.1，致使prometheus收集不到相關的數據？

能夠在初始化以前修改其監聽地址：

apiVersion: kubeadm.k8s.io/v1beta1 kind: ClusterConfiguration controllerManager: extraArgs: address: 0.0.0.0 scheduler: extraArgs: address: 0.0.0.0

若是集羣已經構建好了：

sed -e "s/- --address=127.0.0.1/- --address=0.0.0.0/" -i /etc/kubernetes/manifests/kube-controller-manager.yaml
sed -e "s/- --address=127.0.0.1/- --address=0.0.0.0/" -i /etc/kubernetes/manifests/kube-scheduler.yaml

二、metrics-server不能使用，報錯不能解析node節點的主機名？

須要修改deployment文件，

- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

三、metrics-server報錯，x509,證書是非信任的？

 command:
        - /metrics-server
        - --kubelet-insecure-tls

四、完整的配置文件

containers: - name: metrics-server image: k8s.gcr.io/metrics-server-amd64:v0.3.1 command: - /metrics-server - --metric-resolution=30s - --kubelet-insecure-tls - --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。