【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

导读:本篇文章讲解 【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上),希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com

目录

一、Prometheus 基本介绍

二、Prometheus 特点

样本

三、Prometheus 组件介绍

四、Prometheus 工作流程

五、Prometheus 和 zabbix 对比分析

六、Prometheus 的几种部署模式 

6.1 基本高可用模式

6.2 基本高可用 + 远程存储

6.3 基本 HA + 远程存储 + 联邦集群方案

七、Prometheus 的四种数据类型

7.1 Counter

7.2 Gauge

7.3 histogram

7.4 summary

八、Prometheus 对 kubernetes 的监控


  • 项目环境:

        Prometheus+grafana+alertmanager 安装在 k8s 集群。

  • k8s-v1.23 环境:
k8s 集群角色 ip 主机名 配置
控制节点 192.168.78.143 k8s-master1 2vCPU / 2Gi 内存
工作节点 192.168.78.144 k8s-node1 2vCPU / 2Gi 内存
工作节点 192.168.78.145 k8s-node2 2vCPU / 2Gi 内存
  • 项目目标:

        介绍 k8s 集群中部署 prometheus、grafana、alertmanager,并且配置 prometheus 的动态、静态服务发现,实现对容器、物理节点、service、pod 等资源指标监控,并在 Grafana 的 web 界面展示 prometheus 的监控指标,然后通过配置自定义告警规则,通过 alertmanager 实现qq、钉钉、微信报警。Promql 语法、prometheus 数据类型。

一、Prometheus 基本介绍

        Prometheus(普罗米修斯) 是一个开源的系统监控和报警系统,现在已经加入到 CNCF 基金会,成为继 k8s之后第二个在 CNCF 托管的项目,在 kubernetes 容器管理系统中,通常会搭配 prometheus 进行监控,同时也支持多种 exporter 采集数据,还支持 pushgateway 进行数据上报,Prometheus 性能足够支撑上万台规模的集群。

二、Prometheus 特点

  1. 多维度数据模型:每一个时间序列数据都由 metric 度量指标名称和它的标签 labels 键值对集合唯一确定。这个metric 度量指标名称指定监控目标系统的测量特征(如:http_requests_total- 接收 http 请求的总计数)。labels 开启了 Prometheus 的多维数据模型:对于相同的度量名称,通过不同标签列表的结合, 会形成特定的度量维度实例。(例如:所有包含度量名称为 /api/tracks 的 http 请求,打上method=POST 的标签,则形成了具体的 http 请求)。这个查询语言在这些度量和标签列表的基础上进行过滤和聚合。改变任何度量上的任何标签值,则会形成新的时间序列图。
  2. 灵活的查询语言(PromQL):可以对采集的 metrics 指标进行加法、乘法、连接等操作。
  3. 可以直接在本地部署,不依赖其他分布式存储。
  4. 通过基于 HTTP 的 pull 方式采集时序数据。
  5. 可以通过中间网关 pushgateway 的方式把时间序列数据推送到 prometheus server 端。
  6. 可通过服务发现或者静态配置来发现目标服务对象(targets)。

  7. 有多种可视化图像界面,如 Grafana 等。

  8. 高效的存储,每个采样数据占 3.5 bytes左右,300万 的时间序列,30s 间隔,保留 60 天,消耗磁盘大概 200G。

  9. 做高可用,可以对数据做异地备份,联邦集群,部署多套 prometheus,pushgateway 上报数据。

样本

在时间序列中的每一个点称为一个样本(sample),样本由以下三部分组成:

  1. 指标(metric):指标名称和描述当前样本特征的 labelsets;

  2. 时间戳(timestamp):一个精确到毫秒的时间戳;
  3. 样本值(value): 一个 folat64 的浮点型数据表示当前样本的值。

通过如下表达方式表示指定指标名称和指定标签集合的时间序列:

<metric name>{<label name>=<label value>, ...}

        例如,指标名称为 api_http_requests_total,标签为 method=”POST” 和handler=”/messages” 的时间序列可以表示为:

        api_http_requests_total{method=”POST”, handler=”/messages”}

三、Prometheus 组件介绍

  1. Prometheus Server:用于收集和存储时间序列数据。

  2. Client Library:客户端库,检测应用程序代码,当 Prometheus 抓取实例的 HTTP 端点时,客户端库会将所有跟踪的 metrics 指标的当前状态发送到 prometheus server 端。
  3. Exporters:prometheus 支持多种 exporter,通过 exporter 可以采集 metrics 数据,然后发送到 prometheus server 端,所有向 promtheus server 提供监控数据的程序都可以被称为exporter。
  4. Alertmanager:从 Prometheus server 端接收到 alerts 后,会进行去重分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件、微信、钉钉、slack 等。
  5. Grafana:监控仪表盘,可视化监控数据。
  6. pushgateway:各个目标主机可上报数据到 pushgateway,然后 prometheus server 统一从pushgateway 拉取数据。

【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

        从上图可发现,Prometheus 整个生态圈组成主要包括 prometheus、server、Exporter、pushgateway、alertmanager、grafana、Web ui 界面;Prometheus server 由三个部分组成:Retrieval、Storage,PromQL。

  1. Retrieval 负责在活跃的 target 主机上抓取监控指标数据;

  2. Storage 存储主要是把采集到的数据存储到磁盘中;
  3. PromQL 是 Prometheus 提供的查询语言模块。

四、Prometheus 工作流程

  1. Prometheus server 可定期从活跃的(up)目标主机上(target)拉取监控指标数据,目标主机的监控数据可通过配置静态 job 或者服务发现的方式被 prometheus server 采集到,这种方式默认的 pull 方式拉取指标;也可通过 pushgateway 把采集的数据上报到 prometheus server 中;还可通过一些组件自带的 exporter 采集相应组件的数据;

  2. Prometheus server 把采集到的监控指标数据保存到本地磁盘或者数据库;
  3. Prometheus 采集的监控指标数据按时间序列存储,通过配置报警规则,把触发的报警发送到 alertmanager;
  4. Alertmanager 通过配置报警接收方,发送报警到邮件,微信或者钉钉等;
  5. Prometheus 自带的 web ui 界面提供 PromQL 查询语言,可查询监控数据;
  6. Grafana 可接入 prometheus 数据源,把监控数据以图形化形式展示出。

五、Prometheus 和 zabbix 对比分析

【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

六、Prometheus 的几种部署模式 

6.1 基本高可用模式

【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

        基本的 HA 模式只能确保 Promthues 服务的可用性问题,但是不解决 Prometheus Server 之间的数据一致性问题以及持久化问题(数据丢失后无法恢复),也无法进行动态的扩展。因此这种部署方式适合监控规模不大,Promthues Server 也不会频繁发生迁移的情况,并且只需要保存短周期监控数据的场景。

6.2 基本高可用 + 远程存储

【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

        在解决了 Promthues 服务可用性的基础上,同时确保了数据的持久化,当 Promthues Server 发生宕机或者数据丢失的情况下,可以快速的恢复。同时 Promthues Server 可能很好的进行迁移。因此,该方案适用于用户监控规模不大,但是希望能够将监控数据持久化,同时能够确保Promthues Server 的可迁移性的场景。 

6.3 基本 HA + 远程存储 + 联邦集群方案

【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(上)

        Promthues 的性能瓶颈主要在于大量的采集任务,因此用户需要利用 Prometheus 联邦集群的特性,将不同类型的采集任务划分到不同的 Promthues 子服务中,从而实现功能分区。例如一个 Promthues Server 负责采集基础设施相关的监控指标,另外一个 Prometheus Server 负责采集应用监控指标,再有上层 Prometheus Server 实现对数据的汇聚。 

七、Prometheus 的四种数据类型

7.1 Counter

Counter 是计数器类型:

  • Counter 用于累计值,例如记录请求次数、任务完成数、错误发生次数。
  • 一直增加,不会减少。
  • 重启进程后,会被重置。

例如:

http_response_total{method=”GET”,endpoint=”/api/tracks”}  100

http_response_total{method=”GET”,endpoint=”/api/tracks”}  160

        Counter 类型数据可以让用户方便的了解事件产生的速率的变化,在 PromQL 内置的相关操作函数可以提供相应的分析,比如以 HTTP 应用请求量来进行说明:

  • 通过 rate() 函数获取 HTTP 请求量的增长率

        rate(http_requests_total[5m])

  • 查询当前系统中,访问量前 10 的 HTTP 地址

        topk(10, http_requests_total)

7.2 Gauge

Gauge 是测量器类型:

  • Gauge 是常规数值,例如温度变化、内存使用变化。
  • 可变大,可变小。
  • 重启进程后,会被重置。

例如:

memory_usage_bytes{host=”master-01″}   100

memory_usage_bytes{host=”master-01″}   30

memory_usage_bytes{host=”master-01″}   50

memory_usage_bytes{host=”master-01″}   80

        对于 Gauge 类型的监控指标,通过 PromQL 内置函数 delta() 可以获取样本在一段时间内的变化情况。例如,计算 CPU 温度在两小时内的差异:

        dalta(cpu_temp_celsius{host=”zeus”}[2h])

        你还可以通过 PromQL 内置函数 predict_linear() 基于简单线性回归的方式,对样本数据的变化趋势做出预测。例如,基于 2 小时的样本数据,来预测主机可用磁盘空间在 4 个小时之后的剩余情况:

        predict_linear(node_filesystem_free{job=”node”}[2h], 4 * 3600) < 0

7.3 histogram

histogram 是柱状图,在 Prometheus 系统的查询语言中,有三种作用:

  1. 在一段时间范围内对数据进行采样(通常是请求持续时间或响应大小等),并将其计入可配置的存储桶(bucket)中. 后续可通过指定区间筛选样本,也可以统计样本总数,最后一般将数据展示为直方图。
  2. 对每个采样点值累计和 (sum)。
  3. 对采样点的次数累计和 (count)。

度量指标名称:[basename]_,上面三类的作用度量指标名称:

  • [basename]_bucket{le=”上边界”}, 这个值为小于等于上边界的所有采样点数量
  • [basename]_sum
  • [basename]_count

小结:如果定义一个度量类型为 Histogram,则 Prometheus 会自动生成三个对应的指标。

为什需要用 histogram 柱状图?

        在大多数情况下人们都倾向于使用某些量化指标的平均值,例如 CPU 的平均使用率、页面的平均响应时间。这种方式的问题很明显,以系统 API 调用的平均响应时间为例:如果大多数 API 请求都维持在 100ms 的响应时间范围内,而个别请求的响应时间需要 5s,那么就会导致某些 WEB 页面的响应时间落到中位数的情况,而这种现象被称为长尾问题。

        为了区分是平均的慢还是长尾的慢,最简单的方式就是按照请求延迟的范围进行分组。例如,统计延迟在 0~10ms 之间的请求数有多少,而 10~20ms 之间的请求数又有多少。通过这种方式可以快速分析系统慢的原因。Histogram 和 Summary 都是为了能够解决这样问题的存在,通过 Histogram 和 Summary 类型的监控指标,我们可以快速了解监控样本的分布情况。

Histogram 类型的样本会提供三种指标(假设指标名称为 <basename>):

        样本的值分布在 bucket 中的数量,命名为 <basename>_bucket{le=”<上边界>”}。解释的更通俗易懂一点,这个值表示指标值小于等于上边界的所有样本数量。

1、在总共 2 次请求当中,http 请求响应时间 <=0.005 秒的请求次数为 0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”0.005″,} 0.0

2、在总共 2 次请求当中,http 请求响应时间 <=0.01 秒的请求次数为 0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”0.01″,} 0.0

 3、在总共 2 次请求当中,http 请求响应时间 <=0.025 秒的请求次数为 0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”0.025″,} 0.0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”0.05″,} 0.0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”0.075″,} 0.0

4、在总共 2 次请求当中,http 请求响应时间 <=10 秒的请求次数为 2

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”10.0″,} 2.0

        io_namespace_http_requests_latency_seconds_histogram_bucket{path=”/”,method=”GET”,code=”200″,le=”+Inf”,} 2.0

所有样本值的大小总和,命名为 <basename>_sum。

注意:

        bucket 可以理解为是对数据指标值域的一个划分,划分的依据应该基于数据值的分布。注意后面的采样点是包含前面的采样点的,假设 xxx_bucket{…,le=”0.01″} 的值为 10,而 xxx_bucket{…,le=”0.05″} 的值为 30,那么意味着这 30 个采样点中,有 10 个是小于 0.01s 的,其余 20 个采样点的响应时间是介于 0.01s 和 0.05s 之间的。

        可以通过 histogram_quantile() 函数
来计算 Histogram 类型样本的分位数。分位数可能不太好理解,你可以理解为分割数据的点。我举个例子,假设样本的 9 分位数(quantile=0.9)的值为 x,即表示小于 x 的采样值的数量占总体采样值的 90%。Histogram 还可以用来计算应用性能指标值(Apdex score
)。

7.4 summary

        与 Histogram 类型类似,用于表示一段时间内的数据采样结果(通常是请求持续时间或响应大小等),但它直接存储了分位数(通过客户端计算,然后展示出来),而不是通过区间来计算。它也有三种作用:

  1. 对于每个采样点进行统计,并形成分位图。(如:正态分布一样,统计低于 60 分不及格的同学比例,统计低于 80分 的同学比例,统计低于 95 分的同学比例);
  2. 统计班上所有同学的总成绩 (sum);
  3. 统计班上同学的考试总人数 (count)。

带有度量指标的 [basename] 的 summary 在抓取时间序列数据有如下命名:

  • 观察时间的 φ-quantiles (0 ≤ φ ≤ 1),显示为 [basename]{分位数=”[φ]”};
  • [basename]_sum,是指所有观察值的总和;
  • [basename]_count,是指已观察到的事件计数值。

样本值的分位数分布情况,命名为 <basename>{quantile="<φ>"}

1、含义:http 请求中有 50% 的请求响应时间是 3.052404983s

        io_namespace_http_requests_latency_seconds_summary{path=”/”,method=”GET”,code=”200″,quantile=”0.5″,} 3.052404983

2、含义:http 请求中有 90% 的请求响应时间是 8.003261666s

        io_namespace_http_requests_latency_seconds_summary{path=”/”,method=”GET”,code=”200″,quantile=”0.9″,} 8.003261666

所有样本值的大小总和,命名为 <basename>_sum

1、含义:http 请求的总响应时间为 51.029495508s

        io_namespace_http_requests_latency_seconds_summary_sum{path=”/”,method=”GET”,code=”200″,} 51.029495508

样本总数,命名为 <basename>_count

1、含义:当前一共发生了 12 次 http 请求

        io_namespace_http_requests_latency_seconds_summary_count{path=”/”,method=”GET”,code=”200″,} 12.0

现在可以总结一下 Histogram 与 Summary 的异同:

它们都包含了 <basename>_sum 和 <basename>_count 指标;

Histogram 需要通过 <basename>_bucket 来计算分位数,而 Summary 则直接存储了分位数的值。

prometheus_tsdb_wal_fsync_duration_seconds{quantile=”0.5″} 0.012352463

prometheus_tsdb_wal_fsync_duration_seconds{quantile=”0.9″} 0.014458005

prometheus_tsdb_wal_fsync_duration_seconds{quantile=”0.99″} 0.017316173

prometheus_tsdb_wal_fsync_duration_seconds_sum 2.888716127000002

prometheus_tsdb_wal_fsync_duration_seconds_count 216

        从上面的样本中可以得知当前 Promtheus Server 进行 wal_fsync 操作的总次数为 216 次,耗时 2.888716127000002s。其中中位数(quantile=0.5)的耗时为 0.012352463,9 分位数(quantile=0.9)的耗时为 0.014458005s。

八、Prometheus 对 kubernetes 的监控

对于 Kubernetes 而言,我们可以把当中所有的资源分为几类:

  1. 基础设施层(Node):集群节点,为整个集群和应用提供运行时资源;
  2. 容器基础设施(Container):为应用提供运行时环境;
  3. 用户应用(Pod):Pod 中会包含一组容器,它们一起工作,并且对外提供一个(或者一组)功能;
  4. 内部服务负载均衡(Service):在集群内,通过 Service 在集群暴露应用功能,集群内应用和应用之间访问时提供内部的负载均衡;
  5. 外部访问入口(Ingress):通过 Ingress 提供集群外的访问入口,从而可以使外部客户端能够访问到部署在 Kubernetes 集群内的服务

因此,如果要构建一个完整的监控体系,我们应该考虑,以下 5 个方面:

  1. 集群节点状态监控:从集群中各节点的 kubelet 服务获取节点的基本运行状态;
  2. 集群节点资源用量监控:通过 Daemonset 的形式在集群中各个节点部署 Node Exporter 采集节点的资源使用情况;
  3. 节点中运行的容器监控:通过各个节点中 kubelet 内置的 cAdvisor 中获取个节点中所有容器的运行状态和资源使用情况;
  4. 如果在集群中部署的应用程序本身内置了对 Prometheus 的监控支持,那么我们还应该找到相应的 Pod 实例,并从该 Pod 实例中获取其内部运行状态的监控指标;
  5. 对 k8s 本身的组件做监控:apiserver、scheduler、controller-manager、kubelet、kube-proxy等。

上一篇文章:

【Kubernetes 企业项目实战】01、使用 kubeadm 安装 K8s-v1.23 高可用集群_Stars.Sky的博客-CSDN博客

下一篇文章:【Kubernetes 企业项目实战】02、基于 Prometheus 和 K8s 构建智能化监控告警系统(中)_Stars.Sky的博客-CSDN博客

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/74531.html

(0)
小半的头像小半

相关推荐

极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!