如何理解运维

米饭2天前行业资讯12

运维工程师
(运营),负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率,优化资源利用率提高整体的投资回报率。
运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。
中文名运维工程师外文名操作技能服务器,操作系统,数据库应用网络,服务器

    职责
        无论做什么运维,运维工程师最基本的职责都是负责服务的稳定性,确保服务可以7 * 24H不间断地为用户提供服务在此之上运维工程师的主要工作职责如下:
        质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。
        效率:用自动化的工具/平台提升软 在研发生命周期中的工程效率。
        成本:通过技术手段优化服务架构,性能调优;通过资源优化组合降低成本,提升ROI。
        从产品的生命周期来看:
        1.产品发布前:负责参与并审核架构设计的合理性和可运维性,以确保在产品发布之后能高效稳定的运行
        2。产品发布阶段:负责用自动化的技术或者平台确保产品可以高效的发布上线,之后可以快速稳定迭代。
        3.产品运行维护阶段:负责保障产品7 * 24H稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。
    工作内容
        在软件产品的整个生命周期中运维职业:工程师都需要适时地参与并发挥不同的作用英文,因此运维工程师的工作内容和方向非常多:
        事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损在这方面主要工作内容有:
        问题发现:设计并开发高效的监控平台和告警平台,使用机器学习,大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
        问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。
        问题跟踪:通过分析问题发生时系统的各种表现(日志,变更,监控)确定问题发生的根本原因,制定并开发预案工具。
        变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作在这方面运主要工作内容有:
        配置管理:通过配置管理平台(自研,开源)管理服务涉及到的多个模块,多个版本的关系以及配置的准确性。
        发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。
        容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之在这方面主要工作内容有:
        容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。
        容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案比如通过调整系统参数,优化服务部署架构等方法来高效的提升系统容量。
        架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
    能力要求
      基础技能:
        精通壳/ Python的/ Perl的等1至2种编程语言
        熟练掌握常用数据结构状语从句:算法,并能灵活运用
        熟悉基础网络知识
        深入理解的Linux操作系统
      加分技能:
        熟悉开源的监控平台工具,比如:神经节,Nagios的等
        熟练掌握外壳脚本熟悉awk中,桑达基础等工具
        熟悉分布式计算或者存储系统- ,比如Hadoop的/ HBASE /暴等
        熟悉学习机器原理能付诸实践者更佳
        熟悉TCP / IP,HTTP等网络协议,精通插座编程网络
    软素质要求
        强烈的责任心与主动性,对所负责工作有所有者意识,并自我能驱动成长
        能承担较大工作压力,有较强独立分析,问题解决能力的
        工作中需要胆大心细,探索具备创新精神
    职业发展
        运维人员的要求特别严苛,因为运维人员针对不同的问题,需要不断的补充扩大自己的知识和研究范畴。
        在初级阶段,优秀运维人员会体现出格外出众的主动性和责任心,面对陌生的业务会主动学习和拓展自己对业务对认识和相应的知识范畴,以能够足够的胜任业务的独立维护。
        在逐步的发展阶段中,注重总结反省的工程师会逐渐成长为高阶运维人员,通常他们会有比较体系化的服务运维理解。也有一部分工程师由于出色的项目管理规划能力,逐渐成为项目经理。
        再进一步的发展,高阶的运维人员对于产品的理解将非常的透彻,因而在这种情况下,高阶运维人员甚至可以成为产品的产品经理,产品研发的咨询顾问,在产品功能的设计与开发中起到至关重要的角色。
    前景
        运维所涉及的知识面,专业点非常广,对从业人员素质也要求非常高,运维工作在大型互联网公司也越来越重要。随着互联网的高速发展,网站规模越来越大,架构越来越复杂,对 站运维工程师的需求也会越来越急迫,特别是对有经验的运维人才需求量大,而且是越老越值钱。

    转载于:https://www.cnblogs.com/lixinjie-98/p/10019060.html

    本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!  

    云掣基于多年在运维领域的丰富时间经验,编写了《云运维服务白皮书》,欢迎大家互相交流学习:

    《云运维服务白皮书》下载地址:https://fs80.cn/v2kbbq

    想了解更多大数据运维托管服务、数据库运维托管服务、应用系统运维托管服务的的客户,欢迎点击云掣官网沟通咨询:https://yunche.pro/?t=shequ


    相关文章

    【网络】NAT、代理服务、内网穿透(1)

    【网络】NAT、代理服务、内网穿透(1)

    1.NAT技术NAT(Network Address Translation,网络地址转换)技术,是解决IP地址不足的主要手段,并且能够有效地避免来自网络外部的攻击,隐藏并保护网络内部的计算机。1.1...

    MyBatisPlus从零到一:快速入门与核心功能详解(2)

    MyBatisPlus从零到一:快速入门与核心功能详解(2)

    二、核心功能刚才的案例中都是以 id 为条件的简单 CRUD,一些复杂条件的 SQL 语句就要用到一些更高级的功能了。2.1 条件构造器:除了新增以外,修改、删除、查询的 SQL 语句都需要指定 wh...

    IDC:疫情下,第三方云管理服务市场逆势增长!

    IDC:疫情下,第三方云管理服务市场逆势增长!

    IDC预测,中国第三方云管理服务在2019年到2023年间将保持54.7%的增长率,2023年市场规模预计达到32.1亿美元。2019年第三方云管理服务市场呈现出如下特点:云管理服务成为众多服务商的战...

    Linux CentOS7虚拟机配置静态IP并允许上网的配置方法

    Linux CentOS7虚拟机配置静态IP并允许上网的配置方法

    前言当我们成功的将CentOS镜像安装到了我们的虚拟机上后,可是这个时候,虚拟机还没有配置IP信息,为了后面开发方便,我们需要设置一个静态IP。一、开启本地电脑VMnet8本地电脑,右键点击网络-&g...

    云端之上的边缘:解读云计算与边缘计算的战略融合

    云端之上的边缘:解读云计算与边缘计算的战略融合

    一、引言在当前的信息化和数字化浪潮中,云计算和边缘计算作为两种重要的计算模型,各自在不同的场景中发挥着不可替代的作用。它们不仅在概念、特点、应用场景上有所不同,而且在实际应用中常常相互协作,形成了一种...

    深入了解Linux命名空间中cgroups相关概念:打开容器技术的黑匣子

    深入了解Linux命名空间中cgroups相关概念:打开容器技术的黑匣子

    一、cgroups概念cgroup全称是control groups,被整合在了linux内核当中,把进程(tasks)放到组里面,对组设置权限,对进程进行控制。可以理解为用户和组的概念,用户会继承它...

    发表评论    

    ◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。