大数据自动化巡检系统使用说明

楼高2年前技术文章1270

1. 大数据自动化巡检系统首页显示巡检集群数量、巡检模版、巡检指标、当日巡检情况等,如下图所示

image.png

image.png

2. 自动化巡检提供基础配置,提供给两种巡检集群对接方式,一种是可以对接外部集群,通过系统接口调用,一种是系统提供集群管理,可以导入集群信息

image.png

3. 基础配置管理提供巡检指标配置和修复指导,巡检指标可以自定义,同时提供巡检错误项的修复指导

4. 巡检模版提供配置巡检,可以根据业务配置组件巡检,集群巡检,主机巡检等模版

image.png

5. 基础配置完成之后可以创建巡检任务,巡检任务分为周期任务巡检和手动任务巡检

image.png

6. 配置完任务之后,任务会根据定时时间插入调度队列,按照定时时间执行巡检任务,待任务执行完成之后可在任务实例里面,点击详情查看巡检结果

image.png

7. 报告管理里面提供报告预览和报告导出功能,提供详细的巡检报告

image.png

8. 可根据巡检结果查看巡检修复,按照修复步骤去排查问题

相关文章

为什么根据时间戳获取topic的offset为空呢

为什么根据时间戳获取topic的offset为空呢

一、前言最近有一个需求,要查询某一时间戳对应的offset值,于是就想到了使用 ./bin/kafka-run-class.sh kafka.tools.GetOffsetShell --time &...

MySQL主从复制配置

一、master服务器配置1)用户添加及授权在master 服务器授权一个账户,拥有slave权限12mysql> GRANT REPLICATION SLAVE,REPLICATION CLI...

Trino开启ldap认证

Trino开启ldap认证

1、背景由于对于安全监管的要求,需要对trino服务开启安全认证体系。2、基于私有证书的httpskeytool -genkeypair -validity 36500 -ext SAN=IP:172...

Trino对接haproxy开启ssl

Trino对接haproxy开启ssl

1、背景客户在开启https后,在高并发的情况下,集群性能下降严重。初步估计是由于worker和Coordinator交互都需要进行加密和解密,会提高cpu使用率,导致服务变慢。现在采用haproxy...

apiserver指标分析

apiserver指标分析

概述kube-apiserver 是集群所有请求的入口,指标的分析可以反应集群的健康状态。Apiserver 的指标可以分为以下几大类:请求速率和延迟控制器队列的性能etcd 的性能进程状态:文件系统...

Doris性能测试

Doris性能测试

1.性能测试(1)环境信息硬件环境 软件环境l Doris 部署 3BE 3FE;l 内核版本:Linux version 5.5.0-96-genericl 操作系统版本:CentOS Linux...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。