ACOS统一监控-应用监控

文静8个月前技术文章257


    在智能运维中的应用(APM)监控可谓是老生常谈,实现各个应用数据交互全面、安全、稳定的控制是应用监控核心价值。在应用监控的实现上各大产品也是尽显其能,总的来说都离不开全栈、端到端、链路、根因诊断核心能力。其被客户所选择的关键还是要看核心能力的是否是深入探究。下面介绍一下ACOS应用监控:应用监控是什么?怎么做?还将做些什么?

ACOS应用监控是什么?

    应用监控是指对微服务架构下应用程序的运行状态、性能指标以及异常情况进行实时监测和记录的过程。它涵盖了对应用程序的各个组件、服务、资源的监控,以及对关键指标的收集、分析和报告。

ACOS应用监控怎么做?

1、应用接入及探针

    应用监控支持上报Java语言、GO语言、.NET语言、C++语言、Node语言、Python语言、PHP语言、Ruby语言、Rust9种语言数据。上报Java应用数据提供SkyWalking以及自研(acos-agent)探针方式,自研探针无损统计整体消耗不足5%,对于k8s环境的采集探针支持arm和x86双架构。上报多语言应用数据提供Jaeger、Zipkin、OpenTelemetry 等开源探针方式。对于不同探针上报数据格式acos平台已将其统一处理为OT数据模型。采用统一数据采集上报格式可以使数据更加规范化和易于管理,降低数据处理成本,同时也方便了数据交换和共享。

2、应用中关系/非关系型数据库调用

    数据库是应用程序的核心存储系统,它存储着大量的业务数据,因此数据库的稳定性、性能和安全性对应用程序的正常运行和用户体验至关重要。ACOS支持关系型数据有 :MYSQL、Oracle、SQLServer、PgSQL、MariDb、InfuxDB、ClickHouse、PolarDB、OceanBase达梦、人大金仓 、TiDB、 TDSQL、AnalyticDB、华为GaussDB、openGauss、神州通用openGauss、南大通用GBase、巨杉数据库Redis、非关系数据库有:Memcached、Elasticsearch、MongoDB、KUDU、HBase。通过对数据库指标时序统计、错慢分析以及调用链路追踪确保数据库的安全性及时监测数据层故障和恢复。

3、应用定时任务监测

    定时任务指在预定的时间间隔或特定时刻自动执行的任务,包括定时备份、数据同步、数据清理等。ACOS支持监控定时任务类型有XXL-Job、ScheduleX、Spring-Schedule、Quartz、ElasticJob。通过对任务的执行情况错误时序、异常统计来优化任务性能及时处理程序漏洞。

4、应用外部调用

    外部调用是指应用程序与外部系统、服务或API之间的交互。这些外部调用可能涉及到访问第三方服务、数据库、消息队列等。ACOS支持监控外部调用类型有HTTP、DUBBO、HSF、DSF、GRPC、THRIFT、SOFA。外部调用监控可以实时监测外部调用的成功与失败情况,包括调用的响应时间、错误码、错误信息等。通过监控外部调用的故障情况,可以及时发现和解决问题。

5、应用MQ监控

    消息是应用程序之间进行异步通信的重要方式。ACOS支持上报RabbitMQ、Kafka消息队列发送消息的情况以及消息队列接收消息的情况.实时监测消息的发送和接收情况,包括消息的成功投递、失败投递、重试次数等。通过监控消息的故障情况,可以及时发现和解决问题,防止消息丢失、阻塞或异常,确保应用消息通信的稳定性和可用性.

6、应用自定义

    ACOS考虑到对采集性能消耗支持采样率配置、对开源插件数采集开关设置,可以按需配置; 同时也支持上报数据黑白名单、方法栈、线程、在线诊断以及调用链压缩的设置。

7、常用使用场景

            (1).提供端到端的全链路可观测,全面监控业务流程,实时发现和定位问题;

            (2).将应用监控结合实现“三屏一体”统一可观测视图,提升企业对业务运行状况的掌控力;

            (3).实现应急响应和协同,当系统出现问题时,可自动触发告警通知;

敬请期待:

1、基于 eBPF(extended Berkeley Packet Filter)网络探针技术监控和分析网络流量的方法,实现了高度自动化构建应用监控的全景拓扑,在云原生环境中自动追踪任意微服务、基础设施服务的分布式调用关系。

2、基于业务打标能力构建业务链路来将客户侧繁杂可观测工具有效整合和可视化,避免数据的孤岛。 基于自定义的业务场景构建客户业务的核心全景架构避免业务孤岛。

相关文章

Hdfs3.x新特性详解

Hdfs3.x新特性详解

HDFS Disk Balancer(磁盘均衡器)HDFS Disk Balancer与HDFS Balancer的区别?两者都是实现负载均衡功能HDFS Balancer是之前Hadoop2.x中本...

spark与mr的异同

1.MR:抽象层次低,需要使用手工代码来完成程序编写,使用上难以上手;Spark:Spark 采用RDD 计算模型,简单容易上手。2.MR:只提供map 和reduce 两个操作,表达能力欠缺;Spa...

日志聚合工具loki

1、loki是什么Loki是一个水平可扩展,高可用性,多租户的日志聚合系统,受到Prometheus的启发。它的设计非常经济高效且易于操作,因为它不会为日志内容编制索引,而是为每个日志流编制一组标签。...

oracle手工完全恢复

一)基本概念1)完全恢复的步骤1)restore: OS拷贝命令还原所有或部分datafile2)recover:SQL*PLUS利用归档日志和当前的redo日志做恢复2)完全恢复可以基于三个级别re...

harbor数据迁移-SOP

harbor数据迁移-SOP

背景线下自建harbor需要迁移至云上自建harbor迁移方案harbor私有仓库的主从复制实现数据迁移前置条件harbor目标仓库已部署好,并且版本和源仓库版本最好保持一致迁移步骤1、配置slave...

证书过期问题之IPV6协议

证书过期问题之IPV6协议

1、首先了解情况:客户的SSL/TLS证书要过期了,所以进行了证书替换工作,但是替换之后,有一部分客户端还是提示证书已过期,如图所示:2、看这个报错是非常的清晰的,就是证书过期的问题,但是为什么同事没...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。