rancher上kube-prometheus部署报错处理

琉璃2年前技术文章3048

问题描述

rancher 上安装kube-prometheus,版本:8.3.9  ,Chart 仓库:bitnami

image.png

服务 pod: prometheus-kube-prometheus-prometheus 启动异常

image.png

问题处理

kubectl  describe po -n monitoring  prometheus-kube-prometheus-prometheus-0

报错如下:

caller=main.go:468 level=error msg="Error loading config (--config.file=/etc/prometheus/config_out/prometheus.env.yaml)" file=/etc/prometheus/config_out/prometheus.env.yaml err="parsing YAML file /etc/prometheus/config_out/prometheus.env.yaml: empty duration string"

image.png

查看具体报错信息:

kubectl  describe po -n monitoring  prometheus-kube-prometheus-prometheus-0   | grep  /etc/prometheus/config_out/prometheus.env.yaml

image.png

查看挂载信息

image.png

查看卷信息 ,config-out Type类型为 EmptyDir
备注:

emptyDir类型的volume在pod分配到node上时被创建,kubernetes会在node上自动分配 一个目录,因此无需指定宿主机node上对应的目录文件。这个目录的初始内容为空,当Pod从node上移除时,emptyDir中的数据会被永久删除。

image.png


查看在宿主机上EmptyDir映射信息

image.png

image.png

docker inspect 8ce86e673faa

image.png


cd /var/lib/kubelet/pods/878476b9-4d09-4aca-a2b4-2e3fcc85ed57/volumes/kubernetes.io~empty-dir/config-out

image.png


github 查询资料发现此issues:

What steps will reproduce the bug?

  1. deploy chart v8.2.1+

  2. see error and restarting prometheus pod

it seems setting these values fixes the issue:

在values中添加如下scrapeInterval 、evaluationInterval 值

prometheus:

 scrapeInterval: 1m

 evaluationInterval: 1m

Prometheus以scrape_interval规则周期性从监控目标上收集数据,然后将数据存储到本地存储上。

Prometheus以evaluation_interval规则周期性对告警规则做计算,然后更新告警状态。

 # 评估告警周期   evaluation_interval

# 数据采集间隔   scrape_interval

添加完成后服务正常启动

image.png



image.png


image.png

参考文档:https://github.com/bitnami/charts/issues/13874


相关文章

网络策略NetworkPolicy

网络策略NetworkPolicy

目的:为了实现细粒度的容器间网络访问隔离策略。引用:1.3版本NetworkPolicy机制 -> 1.8版本networking.k8s.io/v1稳定版本功能:对pod、ns之间网络通信限制...

scylladb简单命令介绍

一、cql 命令查看版本SHOW VERSION查看连接的数据库地址SHOW HOST批量执行.cql文件中的命令SOURCE '/home/thobbs/commands.cql'开启和关闭命令追踪...

企业级大数据安全架构(八)

企业级大数据安全架构(八)

前面第七章详细介绍了部署FreeIPA来做kerberos认证,这节接着介绍FreeIPA高可用部署1.FreeIPA高可用配置说明:在安装完一台ipa-server之后,在另一个备份节点部署ipa-...

CDH实操--客户端安装

CDH实操--客户端安装

CDH客户端安装概述安装CDH客户端,主要是方便在CDH部署节点以外,通过客户端的方式连接CDH上的hdfs,hive和hbase服务1、安装jdk(适配CDH即可,一般1.8)2、获取安装包 3、部...

Hbase region移动

Hbase region移动

1、背景由于hbase 表在创建时没有进行预分区,导致自动分裂的region分布到同一region server上。现将region 手动移动到其他节点,使分布均匀2、操作步骤1、找到要移动的regi...

shell编程基础(一)

shell编程基础(一)

1.1 为什么学ShellShell脚本语言是实现Linux/UNIX系统管理及自动化运维所必备的重要工具, Linux/UNIX系统的底层及基础应用软件的核心大都涉及Shell脚本的内容。每一个合格...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。