监控k8s的主流方案是prometheus+grafana两大套件,为了快速部署并监控k8s,目前有两款主流grafana插件提供给了我们方案
1、环境说明
本文环境是二进制部署的k8s
集群,prometheus
和grafana
通过yaml
部署(非operator)
# kubectl version
Client Version: version.Info{Major:"1", Minor:"15", GitVersion:"v1.15.0", GitCommit:"e8462b5b5dc2584fdcd18e6bcfe9f1e4d970a529", GitTreeState:"clean", BuildDate:"2019-06-19T16:40:16Z", GoVersion:"go1.12.5", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"15", GitVersion:"v1.15.0", GitCommit:"e8462b5b5dc2584fdcd18e6bcfe9f1e4d970a529", GitTreeState:"clean", BuildDate:"2019-06-19T16:32:14Z", GoVersion:"go1.12.5", Compiler:"gc", Platform:"linux/amd64"}
# kubectl get pods -n kube-system -l k8s-app=prometheus
NAME READY STATUS RESTARTS AGE
prometheus-0 2/2 Running 0 1m
# kubectl get pods -n kube-system -l app=grafana
NAME READY STATUS RESTARTS AGE
grafana-0 1/1 Running 0 1m
2、grafana-kubernetes-app插件
2.1、插件介绍
Grafana Kubernetes App
可监控Kubernetes集群的性能。它包括4个仪表板,即集群,节点,Pod
/容器和部署。它允许自动部署所需的Prometheus
导出器,并使用默认的scrape
配置与您的集群内Prometheus
部署一起使用。收集的指标是高级集群和节点统计信息,以及较低级别的pod
和容器统计信息。使用高级指标进行警报,使用低级指标进行故障排除。
要求
目前仅支持Prometheus
为了自动部署exporter
,则需要Kubernetes 1.6
或更高版本。
Grafana 5.0.0+
特征
- 该应用程序使用
Kubernetes
标签来过滤Pod
指标。Kubernetes
集群往往有很多Pod
和很多Pod
指标。Pod / Container
仪表板利用了pod
标签,因此可以轻松找到相关的pod
。 - 轻松安装
exporter
,从Grafana
一键式部署,或使用kubectl
手动部署 Heapster
中不可用的群集级别指标,例如CPU
容量与CPU
使用率。
集群指标
- Pod容量/用途
- 内存容量/使用率
- CPU容量/使用率
- 磁盘容量/使用率
- 节点,容器和容器概述
节点指标
- 中央处理器
- 可用内存
- 每个CPU的负载
- 读取IOPS
- 写入IOPS
- 实用率
- 网络流量/秒
- 网络数据包/秒
- 网络错误/秒
Pod/容器指标
- 内存使用情况
- 网络流量
- CPU使用率
- 读取IOPS
- 写入IOPS
2.2、插件安装
进入pod
或者将插件离线下载后上传到/var/lib/grafana/plugins
目录
# kubectl get pods -n kube-system -l app=grafana
NAME READY STATUS RESTARTS AGE
grafana-0 1/1 Running 0 123m
# kubectl -n kube-system exec -it grafana-0 bash
bash-5.0$ grafana-cli plugins install grafana-kubernetes-app
installing grafana-kubernetes-app @ 1.0.1
from: https://grafana.com/api/plugins/grafana-kubernetes-app/versions/1.0.1/download
into: /var/lib/grafana/plugins
✔ Installed grafana-kubernetes-app successfully
Restart grafana after installing plugins . <service grafana-server restart>
提示需要重启服务,此处直接删除pod
,让其重新拉起即可
# kubectl -n kube-system delete pods grafana-0
2.3、插件配置
重新访问grafana界面查看插件列表,找到kubernetes
插件并启用

选择创建集群

配置项如下
- name:名称,自定义
- URL:
api-server
的地址 - Auth:认证信息,勾选
TLS Client Auth
和With CA Cert
- TLS Auth Details
此处配置的是插件连接k8s
的认证信息,这里我们可以新建一个kubeconfig
文件也可以沿用kubectl
使用的kubeconfig
文件,在kubeconfig
文件中的内容使经过base64
编码后的,在这里需要将这些内容解码,类似echo "key内容" | base64 -d
- CA Cert 对应
kubeconfig
中的certificate-authority-data
- Client Cert 对应
kubeconfig
中的client-certificate-data
- Client Key 对应
kubeconfig
中的client-key-data
- CA Cert 对应
- TLS Auth Details
- Datasource:数据源,选择之前配置好的
prometheus
- 除上面内容外,还可以选择通过此插件自动在集群中注入
prometheus
的配置及部署node_exporter
,这里已经部署过了,就不再部署了

如上图所示,填写完后点击Save
,然后等待一会儿查看是否成功

2.4、插件效果
按照上面的操作成功配置后,插件会自动在grafana
中添加多个实用的dashboard
,下图展示其中一个

3、devopsprodigy-kubegraf-app插件
3.1、插件介绍
DevOpsProdigy KubeGraf
是一个非常优秀的Grafana Kubernetes
插件,是Grafana
官方的Kubernetes
插件的升级版本,该插件可以用来可视化和分析Kubernetes
集群的性能,通过各种图形直观的展示了Kubernetes
集群的主要服务的指标和特征,还可以用于检查应用程序的生命周期和错误日志。
要求
要安装使用 DevOpsProdigy KubeGraf
插件需要满足以下要求:
Grafana
> 5.0.0 版本- 需要在
Kubernetes
集群上部署Prometheus + node-exporter + kube-state-metrics
- 依赖
Grafana-piechart-panel
插件
特征
该插件包含3个主要的信息页面,其中包含有关Kubernetes
集群的详细信息
应用概述
该插件可以显示 Kubernetes 集群上面的应用的一些基本监控信息
- 应用程序逻辑图
- Kubernetes 对象的分布
- 可视化应用程序的生命周期和基本特征信息
- 在集群中允许访问的服务端口的描述信息
集群状态
- 关于群集及其中的节点的状态的摘要
- 监视应用程序生命周期的详细信息
- 集群服务器中服务所在位置的可视化表示
节点概述
- 集群节点摘要
- 有关已用和已分配资源(RAM,CPU利用率)以及容器数量的信息
- 豆荚的物理分布
Dashboards
除了在插件主页上提供了常见的信息之外,该插件还提供了另外5个Dashboard
供我们来跟踪集群的各种性能指标
- node dashboard
带有节点指标的Dashboard
,它可以显示资源的使用情况,例如CPU
利用率、内存消耗、空闲/iowait
模式下的CPU
时间百分比以及磁盘和网络的状态 - pod dashboard
可以根据所选择的Pod
来显示对应的资源使用情况 - deployments dashboard
以Deployment
为维度来显示对应的资源对象相关的资源使用情况 - statefulsets dashboard
以Statefulset
为维度来显示对应的资源对象相关的资源使用情况 - daemonsets dashboard
以Daemonset
为维度来显示对应的资源对象相关的资源使用情况
上面三个Dashboard
显示了可用/不可用的应用程序的副本数量以及这些应用程序的容器状态,还会跟踪容器的重启
3.2、插件安装
进入pod
或者将插件离线下载后上传到/var/lib/grafana/plugins
目录
# kubectl get pods -n kube-system -l app=grafana
NAME READY STATUS RESTARTS AGE
grafana-0 1/1 Running 0 130m
# kubectl -n kube-system exec -it grafana-0 bash
bash-5.0$ grafana-cli plugins install devopsprodigy-kubegraf-app
installing devopsprodigy-kubegraf-app @ 1.3.0
from: https://grafana.com/api/plugins/devopsprodigy-kubegraf-app/versions/1.3.0/download
into: /var/lib/grafana/plugins
✔ Installed devopsprodigy-kubegraf-app successfully
Restart grafana after installing plugins . <service grafana-server restart>
bash-5.0$ grafana-cli plugins install Grafana-piechart-panel #按照前面的提示如果没有安装Grafana-piechart-panel插件也需要安装
installing Grafana-piechart-panel @ 1.5.0
from: https://grafana.com/api/plugins/Grafana-piechart-panel/versions/1.5.0/download
into: /var/lib/grafana/plugins
✔ Installed Grafana-piechart-panel successfully
Restart grafana after installing plugins . <service grafana-server restart>
提示需要重启服务,此处直接删除pod
,让其重新拉起即可
# kubectl -n kube-system delete pods grafana-0
3.3、插件配置
同样的,重新访问grafana
界面查看插件列表,找到DevOpsProdigy KubeGraf
插件并启用
点击 Set up your first k8s-cluster
创建一个新的Kubernetes
集群

配置和Kubernetes App
插件一样,这里不再赘述,如图所示

3.4、插件效果

