Pod 资源利用率计算

琉璃1年前技术文章2365

Pod CPU使用率

即在过去的一段时间里进程占用的CPU时间与CPU总时间的比率,如果有多个CPU或者多核,需要将每个CPU的时间相加。

container_cpu_usage_seconds_total是container累计使用的CPU时间,用它除以CPU的总时间,就得到了容器的CPU使用率。

Pod 在1s内累计使用的CPU时间为:

sum(rate(container_cpu_usage_seconds_total(image!=""][1m])) by (pod_name, namespace)

container_spec_cpu_quota 是容器的CPU配额,它的值是:为容器指定的CPU个数*100000。

故,Pod在1s内CPU的总时间为:Pod的CPU核数*1s:

(sum(container_spec_cpu_quota(image!="")/100000) by (pod_name, namespace))

将上面两个公式的结果相除,就得到了容器的CPU使用率:

sum(rate(container_cpu_usage_seconds_total(imagel=")[1m])) by (pod_name, namespace) / (sum(container_spec_cpu_quota(image!="")/100000) by (pod_name, namespace)


Pod 内存使用率

直接用内存实际使用量除以内存限制使用量即可

sum(container_memory_rss(image!-"")) by(pod_name, namespace) / sum(container_spec_memory_limit_bytes(image!-"")) by(pod_name, namespace) * 100 != +inf



Pod文件系统使用量

sum(container_fs_usage_bytes(image!=""]) by(pod_name, namespace) / 1024 / 1024 / 1024


requests和limit值解释

资源限制内部机制使用的是cgroup类型 目录: /sys/fs/cgroup/systemd

k8s采用request和limit两种限制类型来对资源进行分配

request(资源需求):即运行pod的节点必须满足运行pod的最基本需求才能运行pod。

limit(资源限制):即运行pod期间,可能内存使用量会增加,那最多能使用多少内存,这就是资源限额。 资源类型:

requests

requests用于schedule阶段,在调度pod保证所有pod的requests总和小于node能提供的计算能力 requests.cpu被转成docker的--cpu-shares参数,与cgroup cpu.shares功能相同 设置容器的cpu的相对权重 该参数在CPU资源不足时生效,根据容器requests.cpu的比例来分配cpu资源 CPU资源充足时,requests.cpu不会限制container占用的最大值,container可以独占CPU requests.memory没有对应的docker参数,作为k8s调度依据 使用requests来设置各容器需要的最小资源


limits

limits限制运行时容器占用的资源 limits.cpu会被转换成docker的–cpu-quota参数。与cgroup cpu.cfs_quota_us功能相同 限制容器的最大CPU使用率 cpu.cfs_quota_us参数与cpu.cfs_period_us结合使用,后者设置时间周期 k8s将docker的–cpu-period参数设置100毫秒。对应着cgroup的cpu.cfs_period_us limits.cpu的单位使用m,千分之一核 limits.memory会被转换成docker的–memory参数。用来限制容器使用的最大内存 当容器申请内存超过limits时会被终止




相关文章

MySQL运维实战之ProxySQL(9.4)proxysql和后端MySQL自动切换

MySQL运维实战之ProxySQL(9.4)proxysql和后端MySQL自动切换

如上图架构,当后端MySQL主库出现问题,发生主备切换后,如何自动将ProxySQL的读写切换到新的主库上?可以通过mysql_replication_hostgroups表配置实现:insert&n...

tomcat目录和配置文件介绍

一、tomcat目录说明tomcat主目录bin:命令,存放不同平台上启动或关闭的脚本BUILDING.txt&RUNNING.txt:使用文档,告诉用户如何搭建conf:各种全局配置文件,最...

开源大数据集群部署(十二)Ranger 集成 hive

开源大数据集群部署(十二)Ranger 集成 hive

1、解压安装在hd1.dtstack.com主机上执行(一般选择hiveserver2节点)Ø 解压ranger-2.3.0-hive-plugin.tar.gz[root@hd1.dtstack.c...

MySQL性能优化(二)优化排序操作

MySQL性能优化(二)优化排序操作

排序是数据库的基本功能。一个例子SELECT * FROM audit_log  WHERE user_id = xxx AND&nb...

Flink sql 集成hive metastore

Flink sql 集成hive metastore

1、前置条件**确认hive metastore版本(本次版本3.1.2) **hive metastore 部署成功hive依赖jar包分发到每个flink节点:/flink-1.13.6    ...

oracle回收站简介

一、回收站简介1、概念和功能回收站从ORACLE 10g开始引入,全称叫Tablespace Recycle Bin。回收站实际是一个逻辑区域,使用的已经分配的表空间,表被drop时,数据不会实际删除...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。