rancher上kube-prometheus部署报错处理

琉璃2年前技术文章3603

问题描述

rancher 上安装kube-prometheus,版本:8.3.9  ,Chart 仓库:bitnami

image.png

服务 pod: prometheus-kube-prometheus-prometheus 启动异常

image.png

问题处理

kubectl  describe po -n monitoring  prometheus-kube-prometheus-prometheus-0

报错如下:

caller=main.go:468 level=error msg="Error loading config (--config.file=/etc/prometheus/config_out/prometheus.env.yaml)" file=/etc/prometheus/config_out/prometheus.env.yaml err="parsing YAML file /etc/prometheus/config_out/prometheus.env.yaml: empty duration string"

image.png

查看具体报错信息:

kubectl  describe po -n monitoring  prometheus-kube-prometheus-prometheus-0   | grep  /etc/prometheus/config_out/prometheus.env.yaml

image.png

查看挂载信息

image.png

查看卷信息 ,config-out Type类型为 EmptyDir
备注:

emptyDir类型的volume在pod分配到node上时被创建,kubernetes会在node上自动分配 一个目录,因此无需指定宿主机node上对应的目录文件。这个目录的初始内容为空,当Pod从node上移除时,emptyDir中的数据会被永久删除。

image.png


查看在宿主机上EmptyDir映射信息

image.png

image.png

docker inspect 8ce86e673faa

image.png


cd /var/lib/kubelet/pods/878476b9-4d09-4aca-a2b4-2e3fcc85ed57/volumes/kubernetes.io~empty-dir/config-out

image.png


github 查询资料发现此issues:

What steps will reproduce the bug?

  1. deploy chart v8.2.1+

  2. see error and restarting prometheus pod

it seems setting these values fixes the issue:

在values中添加如下scrapeInterval 、evaluationInterval 值

prometheus:

 scrapeInterval: 1m

 evaluationInterval: 1m

Prometheus以scrape_interval规则周期性从监控目标上收集数据,然后将数据存储到本地存储上。

Prometheus以evaluation_interval规则周期性对告警规则做计算,然后更新告警状态。

 # 评估告警周期   evaluation_interval

# 数据采集间隔   scrape_interval

添加完成后服务正常启动

image.png



image.png


image.png

参考文档:https://github.com/bitnami/charts/issues/13874


相关文章

ES运维(四)扩容方式迁移

ES运维(四)扩容方式迁移

1 迁移概述本次模拟es在线迁移方式:集群扩容-->数据迁移-->老节点下线-->服务重启刷新配置。 中间master替换的时候会有短暂的不可用。 另外业务测需注意:老节点下线前...

Ansible自动化运维平台部署

一、部署前准备部署机器准备计算机名解析关闭防火墙、selinux时间同步软件包获得ssh免密登陆约定事项:所有服务器全部采用静态ip主机名称IP地址manage01192.168.98.200/24n...

Hbase压缩算法

HBase包含两类压缩机制:DataBlockEncode前缀压缩和文件级别的压缩Compress。对于DataBlockEncode前缀压缩,提供了三种算法:PREFIX\DIFF\FAST_DIF...

GitLab 变量的介绍与使用

环境变量是一个动态命名的值,它可以影响正在运行的进程在操作系统上的行为方式。一、环境变量分类在 GitLab CI/CD 中,环境变量分为两部分:预定义环境变量自定义环境变量1.1 预定义环境变量Gi...

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(2)

SpringBootWeb 篇-深入了解 SpringBoot + Vue 的前后端分离项目部署上线与 Nginx 配置文件结构(2)

        3.0 在云服务器进行环境配置        将项目放到云服务器上运行,那么离不开项目所依赖的环境,比如...

Spark对接ranger

Spark对接ranger

1、包如图所示https://dtstack-download.oss-cn-hangzhou.aliyuncs.com/insight/insight-4em/release/hadoop/spar...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。