apiserver指标分析

红米2年前 (2023-12-25)技术文章1786

概述

kube-apiserver 是集群所有请求的入口，指标的分析可以反应集群的健康状态。

Apiserver 的指标可以分为以下几大类：

请求速率和延迟
控制器队列的性能
etcd 的性能
进程状态：文件系统、内存、CPU
golang 程序的状态：GC、进程、线程

基于 RED 方法，评估 apiserver 服务的一些指标：

Rate 速率：每秒的请求数。
Error 错误：失败的那些请求的数量。
Duration 持续时间：这些请求所花费的时间

请求速率和延迟

Rate 速率

sum(rate(apiserver_request_count[5m])) by (resource, subresource, verb)

该查询会列出Kubernetes资源各种操作的五分钟的速率。操作有：WATCH，PUT，POST，PATCH，LIST，GET，DELETE和CONNECT

Error 错误

rate(apiserver_request_count{code=~"^(?:5..)$"}[5m]) / rate(apiserver_request_count[5m])

此查询获取5分钟内错误率与请求率的比率

Duration 请求时间

histogram_quantile(0.9, sum(rate(apiserver_request_latencies_bucket[5m]))
by (le, resource, subresource, verb) ) / 1e+06

查看 90%情况下请求的时间分布

队列情况

所有资源的请求都会被 apiserver 中的 controller 处理，controller 维护了队列，队列的一些指标可以反应资源处理的速度等指标

以apiserver_admission_controller为例：

apiserver_admission_controller_admission_duration_seconds：准入控制器的处理时间以秒为单位），通过名称进行标识，并针对每个操作以及API资源和类型（验证或准入）进行细分。
apiserver_admission_controller_admission_latencies_milliseconds 延迟*

ETCD 的指标

API Server对etcd 的读写有缓存

etcd_helper_cache_entry_count —缓存中的元素数。
etcd_helper_cache_hit_count —缓存命中计数。
etcd_helper_cache_miss_count —缓存未命中计数。
etcd_request_cache_add_latencies_summary —将条目添加到缓存的时间（以微秒为单位）。

程序指标

apiserver 是 go 程序，目前所有 prometheus 采集的指标都会包含 golang 程序指标，如：

go_gc_duration_seconds 程序 GC 的耗时
go_gc_duration_seconds_count 程序 GC 的次数
go_gc_duration_seconds_quantile 程序 GC 的耗时分布
go_goroutines goroutines信息
go_info go环境信息

request

apiserver_request 请求信息
apiserver_request_count 请求次数
apiserver_request_duration_seconds 请求耗时

response

apiserver_response_sizes 每个组，版本，动作，资源，子资源，范围和组件的响应大小分布（以字节为单位）
apiserver_response_sizes_bucket 区间分布
apiserver_response_sizes_count 返回的数量

audit

apiserver_audit_event：审计事件
apiserver_audit_requests_rejected：审核拒绝的请求

参考

访问 apiserver 的 metric 时需要的参数

返回列表

上一篇：ElasticSearch开启xpack

下一篇：CDH配置HTTPS访问

相关文章

PG的pathman分区表工具

一、概述在PG<=10的版本中，都是通过表继承的方式进行分区的，必须使用CHECK CONSTRAINT将每个分区创建为子表。PostgreSQL 10提供了本机分区，它与经典方法没有什么不同...

大数据高可用系列--kudu高可用应急方案

大数据高可用系列--kudu高可用应急方案

1 设置机架感知1.1 前置说明 1.9版本后的kudu已经支持机架感知（cdh6之后的版本中的kudu已支持），由于kudu的每个Tablet一般是三副...

gitlab的部署

gitlab的部署

一、GitLab简介GitLab 是一个用于仓库管理系统的开源项目。使用Git作为代码管理工具，并在此基础上搭建起来的web服务。可通过Web界面进行访问公开的或者私人项目。它拥有与Github类似的...

Debezium抽取SQL Server同步kafka

Debezium抽取SQL Server同步kafka

ebezium SQL Server连接器捕获SQL Server数据库模式中发生的行级更改。官方2.0文档：https://debezium.io/documentation/reference/2...

Hbase压缩算法

HBase包含两类压缩机制：DataBlockEncode前缀压缩和文件级别的压缩Compress。对于DataBlockEncode前缀压缩，提供了三种算法：PREFIX\DIFF\FAST_DIF...

SQL Server优化入门系列（一）——快速定位阻塞SQL

SQL Server优化入门系列（一）——快速定位阻塞SQL

引言我们在运维数据库的时候，经常会面对这样的问题：数据库现在运行得怎么样有哪些会话在执行，当前状态是什么，在执行什么SQL哪些会话被阻塞，阻塞原因是什么会话是从哪些IP连接过来的，使用了什么账号通过这...

发表评论