大数据自动化巡检系统使用说明

楼高2年前技术文章1443

1. 大数据自动化巡检系统首页显示巡检集群数量、巡检模版、巡检指标、当日巡检情况等,如下图所示

image.png

image.png

2. 自动化巡检提供基础配置,提供给两种巡检集群对接方式,一种是可以对接外部集群,通过系统接口调用,一种是系统提供集群管理,可以导入集群信息

image.png

3. 基础配置管理提供巡检指标配置和修复指导,巡检指标可以自定义,同时提供巡检错误项的修复指导

4. 巡检模版提供配置巡检,可以根据业务配置组件巡检,集群巡检,主机巡检等模版

image.png

5. 基础配置完成之后可以创建巡检任务,巡检任务分为周期任务巡检和手动任务巡检

image.png

6. 配置完任务之后,任务会根据定时时间插入调度队列,按照定时时间执行巡检任务,待任务执行完成之后可在任务实例里面,点击详情查看巡检结果

image.png

7. 报告管理里面提供报告预览和报告导出功能,提供详细的巡检报告

image.png

8. 可根据巡检结果查看巡检修复,按照修复步骤去排查问题

相关文章

CDP实操--集群扩容

CDP实操--集群扩容

一、前提准备工作1.确保OS的yum源可以正常使用,通过yum repolist命令可以查看到匹配的OS的所有包2.确保Cloudera Manager的yum源运行正常3.hosts文件配置,需要将...

Serverless 技术选型

Serverless 技术选型

在 Serverless 这个大领域中,不只有函数计算这一种产品形态和应用类型,而是面向不同的用户群体和使用习惯,都有其各自适用的 Serverless 产品。例如面向函数的函数计算、面向应用的 Se...

Python 序列化与反序列化

1、为什么要序列化内存中的字典、列表、集合以及各种对象,如何保存到一个文件中?如果是自己定义的类的实例,如何保存到一个文件中?如何从文件中读取数据,并让它们在内存中再次恢复成自己对应的类的实例?要设计...

HDFS FQA-Active Namenode does not exit SafeMode with error :"Protocol message was too large.

1、背景重新启动 Active Namenode 时,它卡在安全模式并报告以下错误:Caused by: java.lang.IllegalStateException: ...

阿里云配置 keepalived

1 安装 keepalivedyum install keepalivedmv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.c...

压测实操--kafka-consumer压测方案

压测实操--kafka-consumer压测方案

环境信息:操作系统centos7.9,kafka版本为hdp集群中的2.0版本。Consumer相关参数使用Kafka自带的kafka-consumer-perf-test.sh脚本进行压测,该脚本参...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。