NAS文件被删除问题排查

小丫2年前技术文章975

一、问题现象

客户业务方反馈服务器上挂载的nas文件被删除,业务中许多文件丢失,业务受到严重影响。需要我方协助排查。

二、问题背景

该nas挂载到两台业务服务器上,后端应用为java应用,存储内容为jpg、png、xls等格式的文件

三、排查思路

1.查看服务器系统日志、用户日志都没有相关删除的记录

2.阿里云后台可以查看到相关文件删除的时间点以及执行删除操作的客户端IP,为nas挂载的两台后端服务器的ip,跟阿里云确认NAS本身不存在问题,文件确实是由这两台服务器异常删除的

3.尝试安装systemtap工具,由于系统gcc版本不支持,导致脚本无法运行

4.一番周折后,决定使用系统审计工具audit来记录删除操作的日志

安装步骤

yum install audit

auditctl -a always,exit -S 87 -S 263

systemctl start auditd

5.安装完成后,日志记录/var/log/audit/audit.log

6.问题复现后,查看日志,在每条删除操作前,会有对应的java进程的执行记录,确认是应用代码内做了删除逻辑。提供给开发进行代码排查

image.png

image.png

相关文章

Ansible自动化运维平台部署

一、部署前准备部署机器准备计算机名解析关闭防火墙、selinux时间同步软件包获得ssh免密登陆约定事项:所有服务器全部采用静态ip主机名称IP地址manage01192.168.98.200/24n...

Oracle上云找云掣

背景介绍:随着公有云技术成熟、稳定,越来被大中企业接受。自建IDC机房大成本投入终被云的高效方便稳定所替代。企业基于0racle核心的业务系统势必上云,企业面临0racle如何上云,上云后如何保障数据...

RAID磁盘阵列详解

RAID磁盘阵列详解

1 RAID原理无论是DAS、NAS还是SAN,都是存储系统,一个存储系统可以包含多块磁盘。不同磁盘之间的组织排列,就是磁盘阵列技术,也就是RAID技术。RAID磁盘阵列技术的核心思想主要有两个,包括...

dolphinscheduler部署-FAQ

dolphinscheduler部署-FAQ

如果是cdh集群会遇到一个问题5678端口被占用这是因为cdh的agent用了5678那我们改下配置文件文件:/opt/apache-dolphinscheduler-3.1.8-bin/st...

Kafka 单条日志传输大小

kafka 对于消息体的大小默认为单条最大值是1M 但是在我们应用场景中, 常常会出现一条消息大于1M,如果不对kafka 进行配置。则会出现生产者无法将消息推送到kafka 或消费者无法去消费kaf...

网络抓包实战

网络抓包实战

1、为什么要学习抓包?主要是因为碰到网络相关问题,如果不进行抓包的话,可能会很难进行定位解决,抓包可以看做是另类的日志信息收集。对于解决网络问题至关重要。2、抓包普通环境tcpdump -- a po...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。