NAS文件被删除问题排查

小丫4个月前技术文章163

一、问题现象

客户业务方反馈服务器上挂载的nas文件被删除,业务中许多文件丢失,业务受到严重影响。需要我方协助排查。

二、问题背景

该nas挂载到两台业务服务器上,后端应用为java应用,存储内容为jpg、png、xls等格式的文件

三、排查思路

1.查看服务器系统日志、用户日志都没有相关删除的记录

2.阿里云后台可以查看到相关文件删除的时间点以及执行删除操作的客户端IP,为nas挂载的两台后端服务器的ip,跟阿里云确认NAS本身不存在问题,文件确实是由这两台服务器异常删除的

3.尝试安装systemtap工具,由于系统gcc版本不支持,导致脚本无法运行

4.一番周折后,决定使用系统审计工具audit来记录删除操作的日志

安装步骤

yum install audit

auditctl -a always,exit -S 87 -S 263

systemctl start auditd

5.安装完成后,日志记录/var/log/audit/audit.log

6.问题复现后,查看日志,在每条删除操作前,会有对应的java进程的执行记录,确认是应用代码内做了删除逻辑。提供给开发进行代码排查

image.png

image.png

相关文章

ACOS统一监控-应用监控

    在智能运维中的应用(APM)监控可谓是老生常谈,实现各个应用数据交互全面、安全、稳定的控制是应用监控核心价值。在应用监控的实现上各大产品也是尽显其能,总的来说都离不开全栈、端到端、链路、根因诊...

Python 调用阿里云 OpenAPI 巡检到期云资源

Python 调用阿里云 OpenAPI 巡检到期云资源

前言本篇文章介绍我写的一个程序,通过调用阿里云 OpenAPI 巡检即将到期的云资源。https://github.com/COOH-791/cloud_instance_sentry1. 用途说到云...

kafka文件存储机制

kafka文件存储机制

Topic 数据的存储机制       Topic是逻辑上的概念,而partition是物理上的概念,每个partition对应于一个log文件,该log文件中存储的就是Producer生产的数据。P...

Linux高并发FastCGI优化

nginx中FastCGI相关参数优化:1)这个指令为FastCGI缓存指定一个路径,目录结构等级,关键字区域存储时间和非活动删除时间。fastcgi_cache_path /usr/local/ng...

企业级大数据安全架构(十)

企业级大数据安全架构(十)

一、DBeaver连接Kerberos认证下的hive1.配置本地hosts因为Kerberos认证过程及集群服务中,很多是以主机名的形式进行访问的,所以工作机要设置hosts. 域名映射,我们通过部...

MySQL 异常:max key length is 767 bytes

MySQL 异常:max key length is 767 bytes

前言最近迁移几张表,又遇到 767 异常,迁移前只检查了 sql_mode 忽略对比了这个参数,导致几张表创建失败,其实解决方法也很简单,开启 innodb_large_prefix 参数重新导入即可...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。