实际工作情况是述职报告的依据,能够让领导了解我们的人员管理能力,基于实际工作情况的述职报告能够展示我们的时间管理能力和任务分配能力,下面是路路文书网小编为您分享的运维述职报告5篇,感谢您的参阅。
运维述职报告篇1
一、个人岗位主要职责
主要职责:协助杨主任做好运维部,兼任网管监控中心管理;1、负责每日24小时网络监控;2、管理网管监控中心日常生产;3、定期分析网络运行质量及业务响应情况并进行考核;4、负责电路调度及考核;5、网间通信质量管理,协调处理有关互联互通重大、疑难问题;6、网间业务码号开放管理;7、组织落实交换专业的日常维护,制订维护作业计划;8、制订交换专业应急调度预案,落实各项网络安全措施,确保交换专业网络的稳定运行;9、负责交换专业的技术支撑,确保网络安全运行。
二、个人岗位量化指标
(一)交换专业
主要任务:1、加强网络运行分析,合理优化网络,提高网络运行质量;2、组织落实各类数据统计、报表上报。管控数据及标准:1、合理组织安排交换网络调度;
2、落实应急调度预案,降低障碍处理时间,确保2类故障,处理时限应不超过4小时;3、省公司考核:交换方面,长途电话网网络接通率≥97;本地来话接通率≥98;本地去话接通率≥97;4、省公司考核:网间信令数据传送准确率达到95以上;5、报表上报及时率100%。
(二)互联互通
主要:进一步提高互联互通网络运行质量,协调处理网间不规范主叫和异常话务问题。
1、负责协调处理本地网网间通信障碍;2、负责网间扩容改造协调(中继增开、交换机扩容等);3、网间业务码号开放管理。
管控数据及标准:根据管理局规定:要求网间话务传送每小时不规范主叫次数不大于50次。1、一般障碍处理,处理沟通时限为24小时,如超时未解决或对方没有对障碍原因进行书面回复时,上报省公司处理;2、重大事故后4小时内口头上报省公司,24小时内做出简要书面报告,事故处理结束后的5日内做出专题书面报告。3、在进行网间扩容改造时应视改造内容提前通知相关运营商,并做好网间应急预案;4、网间中继扩容因符合信产部相关技术标准(公用电信网间互联中继电路扩容技术要求)。5、按省公司要求:每月5日前完成报表上报。6、根据码号开放文件规定按时开放码号。(三)网管监控
主要:1、组织电路故障处理、派发、指挥调度,收集故障分析报告。2、组织电路调度、测试、开通测试报告收集。3、根据市场部的要求提供资源满足情况和投资需求。
管控数据及标准:1、制订并严格贯彻执行各类管理制度;2、故障处理及时;3、分析认真,及时提交报告和报表;4、电路调度准确合理,开通及时;5、响应大客户中心的方案和重保需求。
三、上半年指标完成情况
1、完成交换专业各项维护作业计划,完成上半年网络运行质量分析材料汇总上报。
2、完成各交换设备扩容、局数据修改,日常故障处理,完成了省公司上半年的各项考核指标。3、定期进行本网固话用户话务流量,ip电话业务流量分析,用户模块端口占用率分析,动态对全区模块进行资源调度,提高了模块端口占用率。4、分析完成了112用户故障数据的统计,通过详细的故障用户数据分析,用户故障类型统计,强化相关的故障处理流程,有效降低了故障历时,减少了用户的投诉数量。4、节前积极进行各交换设备巡检、故障排查,消除了节日期间的故障隐患,定时对各局向话务进行采集分析,对话务量接近门限值的局向作动态跟踪,及时通过增开电路来疏通话务。5、完成07年交换专业应急调度预案修订及本地网互联互通应急转接预案制订,确保了长途、本地网络节日期间高效、稳定的运行。6、制定实施技术方案5个,累计完成省公司各项报表92份,调单40项,反馈及时率99。7、制订完成本地网码号升位方案和计划,完善升位前相关信息的统计与采集分析,顺利完成全省升位演练配合。8、加强了与各运营商的沟通,节前与其它运营商商讨网间话务疏通应急预案,并及时对网间话务进行测算,对高话务量的网间中继与对方进行积极的协调与沟通及时增开电路,确保了网间通信正常。9、配合完成中兴第二关口局建设、本地调测及初验,完成第二关口局设备交换组网方案制定,配合了网间传输第二路由构建协谈。10、春节后对于电信拦截我方码号的情况进行积极处理,及时加强相关的观察与信令跟踪,掌握证据,上报省公司电信封堵码号情况表并提供拨测表,保持与电信进行不断的沟通、协商、处理。11、退租了1条高港长江导航处联通公司的2m电路,6条广电2m电路以及1条电信16900互联网电路,及时核实了我方资源,减少了租用资源,节约了公司运维成本。
四、上半年管理主要成绩
协助主任,量化落实运维部思路,使各项管理规范化、制度化。1、在做好日常监控
管理、网络优化的基础上,较好的完成了一季度的维护。
2、认真履行中心的职责,尽一步完善了中心各项规章制度。3、加强了值班制度、交接班制度、机房管理制度的执行,对违规行为适度进行考核。4、制定了机房卫生值日制度并下发执行。5、对仓库物品整理归类,各专业的备品备件、仪器仪表进行了整理,补全了各项台帐。
五、目前中存在的主要问题
1、个人技术水平及管理水平有待进一步提高;2、中心的凝聚力和创新力还不够高,急需提高整体队伍的素质,加强人员的培训,提高中心人员的维护水平以及障碍处理能力。
六、下半年主要思路
1、进一步提高语音网络接通率;2、加强24小时网络监控;3、合理优化现有网络,提高现有网络质量;4、加强网管监控人员技术培训。
七、近期最重要的及思路
1、做好全网号码升位的准备,能顺利完成本次升位任务;2、盘活资源,合理利用网络资源;3、强化汛期24小时网络监控,保障全网网络安全。
?运维部兼任网管监控中心管理岗位述职报告》来源于网,欢迎阅读运维部兼任网管监控中心管理岗位述职报告。zuk
管理、网络优化的基础上,较好的完成了一季度的维护。
2、认真履行中心的职责,尽一步完善了中心各项规章制度。3、加强了值班制度、交接班制度、机房管理制度的执行,对违规行为适度进行考核。4、制定了机房卫生值日制度并下发执行。5、对仓库物品整理归类,各专业的备品备件、仪器仪表进行了整理,补全了各项台帐。
八、目前中存在的主要问题
1、个人技术水平及管理水平有待进一步提高;2、中心的凝聚力和创新力还不够高,急需提高整体队伍的素质,加强人员的培训,提高中心人员的维护水平以及障碍处理能力。
九、下半年主要思路
1、进一步提高语音网络接通率;2、加强24小时网络监控;3、合理优化现有网络,提高现有网络质量;4、加强网管监控人员技术培训。
十、近期最重要的及思路
1、做好全网号码升位的准备,能顺利完成本次升位任务;2、盘活资源,合理利用网络资源;3、强化汛期24小时网络监控,保障全网网络安全。
运维述职报告篇2
运维部在分公司领导的直接指导下,实时对城区网优不彻底区域地点进行不间断的网优及线路改造工作。这里是一篇运维工程师个人年终总结,接下来让我们一起来看看吧~
20xx年运维部在分公司直接领导下及全体员工的勤奋努力下,顺利完成网络维护、网络建设、网络安全等任务,有力的保证了版纳辖区数字电视业务发展,全年来的工作总结如下:
一、网络维护及建设
1,城域网维护建设
1)、在分公司的正确领导及相关部门的大力支持下,运维部全体人员的勤奋工作。城域网维护截止11月份,运维部共处理用户故障非电子派单电话报修518次,电子派单3687次,安装用户1869户,搬迁用户288户,平移用户147户,开通副机用户152户,提高了网络覆盖质量,更有力的提升了市场竞争力。
2),新区网络新建工程立项7项,实施7项等几个光节点网络覆盖面积,促进了业务发展和业务收入的增加。
3)、完成城域网建成管道建成4.98千米及配套设施建设。
4)、(20xx安全工作年终总结)运维部必须及时认真上报当月的《网络维护月报表》、《安全隐患月报表》、《电子派单周、月报表》、《新装用户月报表》的'工作。
2,网络优化建设
运维部在分公司领导的直接指导下,实时对城区网优不彻底区域地点进行不间断的网优及线路改造工作。
3,乡镇网络建设
1)、根据省、地公司和县分公司安排,在分公司领导亲自带领下,年初对全县所辖区乡镇网络进行了数字电视整转前的规划与设计。
2)、20xx年对全县所辖区20个乡镇中16个乡镇的网络进行优化改造及1个乡镇网络的新建工作。
3)、县乡联网乡镇有线电视用户整转平移3540户,乡镇有线新装电视用户1629户。全县乡镇有线数字电视用户总数5169户。
二、加强技术培训,提高队伍素质
运维部承担分公司工程建设的主要队伍,面对工程建设、网络安全干线安全重要任务,要在短时间内保质保量完成,无论是组织工作,还是技术工作都存在较多的难题。为此,分公司把开展技术培训作为一项确保工程质量、进度的重要措施来抓,采取走出去请进来的方式,不但多次派员工参加省、地公司举行培训学习,经常利用部门开会时间组织运维人员进行集中学习培训,还和邻近兄弟公司进行面对面经验和技术的交流,提高了维护人员的技能20xx年运维工程师年终总结工作总结。
三、存在问题及不足
1、目前运维部整体须加强思想认识、提高工作效率、提升服务水平。
2、特别注重安全生产,搞好网络干线巡检工作。
3、运维部目前极其缺乏新技术、新业务的尖端人才,针对下一步的数字双向网络、数据等新业务,加强能承担新的维护任务技术的培训及业务学习。
4、加强运维文档的管理,提高维护质量。做好每月必须及时认真上报的各类报表。
5、随着城区网络的进一步扩大,交通工具的问题不多地制约着运维部的快速反应机制。
四、20xx年工作计划
1、继续抓好网络维护质量管理和科技维护水平,提高网络运行质量
2、继续抓好、抓实省一二干线巡查工作。
3、积极配合做好城域网、本地传输网、城区管道及乡镇网络建设服务等工作的准备开工建设及其他工作任务。
4、按计划搞好网络新建、小区新建的立项及建设和竣工及验收工作。
5、落实运维部的各项管理制度,明确目标管理,理顺工作流程,提高工作效率、提升服务水平。
6、完善安全生产制度,搞好安全生产工作。
运维述职报告篇3
过去的一年,我认真贯彻执行市公司工作的指导思想和总体要求,牢固树立“用户至上,用心服务”的理念,转变观念,增强维护工作的主动性和预防性。树立“维护就是经营”的思想,保证了业务收入的持续增长。
一、机房职守工作。
我知道机房值守工作,责任重于泰山!每天上班的第一件事就是先检查网管系统等告警平台是否正常运行,监控系统不是摆设,在平时工作中,要充分发挥其作用,就需要很强的责任心。一旦出现告警信息,无论白天黑夜,我都是第一时间通知相关人员,并加强信息的沟通,清楚故障的发现和处理流程,保证故障信息的畅通传递,更快的得到解决。
在日常处理工单的时候,都能及时的派单,回笼,因为我知道一张工单就是一位用户,就是一张口碑,每天都是不少于几十张的工单,认真对待每一张,从未出现过超时工单,这就是对服务质量的体现。一旦遇到系统上的漏洞问题,我都一一做了登记,及时的上报相关领导,力求完善系统,提高工作效率。
二、可视会议管理。
做到了了解设备的性能和原理,熟悉精通可视会议的相关业务,平时也对设备进行检修、维护,保障了设备的正常运转,确保了可视会议及时无误的召开。截止昨天,本年度召开了xx场会议,本公司xx场,政府部门xx场,其他测试xx次等。
在平时工作中,积极主动,敢于负责,忠于职守,办事效率高,遇事不推诿,热爱本职工作,努力为实现公司方针目标而踏实工作。绝不做法律和公司制度不允许的事,坚守劳动纪律,工作中充分发挥自己的主动性,热情为用户介绍电信服务项目,耐心解释用户的咨询。公司下达的各项任务指标,都能很好完成。
xx年即将到来,在市场竞争严酷的今天,维护工作要真正做好后台支撑,真正做好“用户至上、用心服务”,在工作中就必须做到有主动性、预见性、创造性开展维护工作。公司新的辉煌是党委和行政的正确领导下,只要运维工程师对一个公司来说是非常重要的岗位,它本身所覆盖的运维职责就很重要,所以,运维对其它关联工种必须非常了解熟悉:网络、系统、系统开发、存储,安全,db等。作为一个运维工程师我认为是集合网络、系统、开发工作于一身的“复合型人才”,就如有些公司把一些合同采购都纳入了运维职责范围,还有如idc网络规划也纳入运维职责。
一、运维工程师岗位职责
1、参与设计、审核、优化公司it系统以及各应用系统的体系架构。
2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台。
3、负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化。
4、建立面向开发部门,业务部门的服务流程和服务标准。
5、负责it运维相关流程的规划、设计、推行、实施和持续改进。
6、响应及解决客户的技术要求、疑问以及系统使用过程中遇到的各种问题。
7、负责日常网络及各子系统管理维护。
8、负责设计并部署相关应用平台,并提出平台的实施、运行报告。
9、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。
10、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。
11、负责网络监控和应急反应,以确保网络系统有7*24小时的持续运作能力。
12、负责日常系统维护,及监控,提供it软硬件方面的服务和支持,保证系统的稳定。
13、负责服务过程中问题现象和处理方案的收集撰写,形成知识库,并对知识库进行维护更新。
14、及时反馈技术处理过程中的提供反馈意见,提升服务支持团队专业度。
二、怎样才算是一个合格的运维工程师
1、保证服务达到要求的线上标准,如99.9%;保证线上稳定,这是运维工程师的基本责职所在。
2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性和创新思维。
3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。
4、通过创新思维解决运维效率问题;目前各公司大部分运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。
5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。
6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。
7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。以上只是技术上的一些层面,当然个人意识也是很重要的。
三、运维管理注意事项
1、配置管理
(1)it资产配置管理:对it资产生命周期进行管理,包括分类统计、预购、选购审核、转移审核、报废审核,保证配置管理正确率达标。
(2)建设案例库:累积和提炼工程师的事件处理经验制作成案例,并持续丰富运维案例库供查询,案例覆盖已知事件的比率达标,不断提高运维工程师工作效率。
(3)it系统配置信息管理:定期更新网络及应用系统描述信息及技术支持信息配置,保证最新;将配置文档上传至服务器端,方便团队其他运维人员进行查看和操作。
2、监控
(1)、服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端webserver,我们就可以有很多种类型的监控,像zabbix,nagios,cacti等监控程序。
(2)、其它就是集群状态类的监控或统计,为我们合理管理调优集群提供数据参考、包括服务瓶颈、性能问题、(1)、硬件故障问题;对于成百上千或上万机器的n多集群,服务器死机、硬件故障概率是非常大的,几乎每时每刻都有服务硬件问题,死机、硬盘损坏、电源、内存、交换机。针对这种情况,我们在设计网站架构时需要充分考虑到这些问题,并将其视为常态;更多的依靠应用的冗余机制来规避这种风险,给系统工程师足够宽裕的处理时间。
(2)、应用故障问题;可能是某一bug被触发、或某一性能阀值被超越、攻击等情况不一而定,但重要的一点,是要有对这些问题的预防性措施,不能想当然,它不会出问题,如真出问题了,如何应对?这需要运维工程师平时做足功夫,包括应急响应速度、故障处理的科学性、备用方案的有效等。
4、问题管理
对事件进行统计分析,找出疑难、重复发生的事件,纳入问题管理流程,分析问题产生的根本原因,确定可能解决的方案,需要修改网络或应用系统配置时提交变更申请触发变更管理流程。
5、安全管理
(1)、操作人员随时监控中心设备运行状况,发现(2)、未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置。
(3)、服务器系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。
(4)、机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。
(5)、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如u盘、移动硬盘等),做到先杀病毒后使用。
(6)、机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。
6、自动化运维
自动化:简而言之,就是将我们日常手动进行的一些工作通过工具,系统自动来完成,解放我们的双手及枯燥的重复性劳动,例如:没有工具前,我们安装系统需要一台台安装,如20xx台,可能需要10人/10天,搞烂n张光盘,人力成本更大,而现在通过自动化工具,只需几个简单命令就能搞定、还有如机器人类程序,自动完成以往每天人工干预的工作,使其自动完成、汇报结果,并具备一定的专家系统能力,能做一些简单的是/非判断、优化选择等,这些好处非常明显不再多说,应该说,自动化运维是运维工程师职业化的一个追求,利已利公,虽然这是一个网络架构变更、idc变更、规范变动等因素,都可能会对现有自动化系统产生影响,所以需要模块化、接口化、变因参数化等因此,自动化相关工作,是运维工程师的核心重点工作之一,也是价值的体现。
四、总结
综上所述,做一个好的运维工程师,除了具备良好的综合技能水平,还要有一个负责任的工作态度,这也是优秀运维工程师具备的素质。因为对于运维工程师而言,每一次故障的发生都不是小事,很可能会影响公司线上业务的稳定性,甚至直接导致公司的经济损失,所以我认为对待工作中发生的故障以及事件要秉着一个“小事件,大处理”的原则,将发生的故障扼杀到摇篮里,慢慢地积累故障处理经验,这样当真正的大事件来临时,我们可以采取有效的措施及时应对。除了处理好发生的故障事件,我觉得运维工程师还应具备可预见性,故障随时可能发生,如何防患于未然,这将是对我们做好运维工作的一个考验。古人云:“不积跬步无以至千里,不积小流无以成江海”运维之路就是由一次次故障事件中拼接出来的,作为其中的一份子,任重而道远!
运维述职报告篇4
运维工程师对一个公司来说是非常重要的岗位,它本身所覆盖的运维职责就很重要,所以,运维对其它关联工种必须非常了解熟悉:网络、系统、系统开发、存储,安全,db等。作为一个运维工程师我认为是集合网络、系统、开发工作于一身的“复合型人才”,就如有些公司把一些合同采购都纳入了运维职责范围,还有如idc网络规划也纳入运维职责。
一、运维工程师岗位职责
1、参与设计、审核、优化公司it系统以及各应用系统的体系架构。
2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台。
3、负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化。
4、建立面向开发部门,业务部门的服务流程和服务标准。
5、负责it运维相关流程的规划、设计、推行、实施和持续改进。
6、响应及解决客户的技术要求、疑问以及系统使用过程中遇到的各种问题。
7、负责日常网络及各子系统管理维护。
8、负责设计并部署相关应用平台,并提出平台的实施、运行报告。
9、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。
10、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。
11、负责网络监控和应急反应,以确保网络系统有7x24小时的持续运作能力。
12、负责日常系统维护,及监控,提供it软硬件方面的服务和支持,保证系统的稳定。
13、负责服务过程中问题现象和处理方案的收集撰写,形成知识库,并对知识库进行维护更新。
14、及时反馈技术处理过程中的异常情况,及时向部门负责人、服务开发pm、客户经理等相关人员报警;同时,主动协调资源推动问题解决。
15、定期对所有服务问题进行分析,并对服务效率有影响的问题提供反馈意见,提升服务支持团队专业度。
二、怎样才算是一个合格的运维工程师
1、保证服务达到要求的线上标准,如99。9%;保证线上稳定,这是运维工程师的基本责职所在。
2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性和创新思维。
3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。
4、通过创新思维解决运维效率问题;目前各公司大部分运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。
5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。
6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。
7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。以上只是技术上的一些层面,当然个人意识也是很重要的。
三、运维管理注意事项
1、配置管理
(1)it资产配置管理:对it资产生命周期进行管理,包括分类统计、预购、选购审核、转移审核、报废审核,保证配置管理正确率达标;
(2)建设案例库:累积和提炼工程师的事件处理经验制作成案例,并持续丰富运维案例库供查询,案例覆盖已知事件的比率达标,不断提高运维工程师工作效率;
(3)it系统配置信息管理:定期更新网络及应用系统描述信息及技术支持信息配置,保证最新;将配置文档上传至服务器端,方便团队其他运维人员进行查看和操作。
2、监控
主要包括故障监控和性能、流量、负载等状态监控,这些监控关系到集群的健康运行,及潜在问题的及时发现与干预。
(1)服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端webserver,我们就可以有很多种类型的监控,像zabbix,nagios,cacti等监控程序。
(2)其它就是集群状态类的监控或统计,为我们合理管理调优集群提供数据参考、包括服务瓶颈、性能问题、异常流量、攻击等问题。
3、故障管理
(1)硬件故障问题;对于成百上千或上万机器的n多集群,服务器死机、硬件故障概率是非常大的,几乎每时每刻都有服务硬件问题,死机、硬盘损坏、电源、内存、交换机。针对这种情况,我们在设计网站架构时需要充分考虑到这些问题,并将其视为常态;更多的依靠应用的冗余机制来规避这种风险,给系统工程师足够宽裕的处理时间。(如google不是号称同时死800台机器,服务不会受到任何影响吗);这就是考验运维工程师及网站架构师功能的地方了,好的设计能达到google所描述自恢复能力,如gfs,糟糕的设计那就是一台服务器的死机可能会造成大面积服务的连锁故障反映,直接对用户拒绝响应。
(2)应用故障问题;可能是某一bug被触发、或某一性能阀值被超越、攻击等情况不一而定,但重要的一点,是要有对这些问题的预防性措施,不能想当然,它不会出问题,如真出问题了,如何应对?这需要运维工程师平时做足功夫,包括应急响应速度、故障处理的科学性、备用方案的有效等。
4、问题管理
对事件进行统计分析,找出疑难、重复发生的事件,纳入问题管理流程,分析问题产生的根本原因,确定可能解决的方案,需要修改网络或应用系统配置时提交变更申请触发变更管理流程。
5、安全管理
(1)操作人员随时监控中心设备运行状况,发现异常情况应立即按照应急预案规程进行操作,并及时上报和详细记录。
(2)未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置。
(3)服务器系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。
(4)机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。
(5)严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如u盘、移动硬盘等),做到先杀病毒后使用。
(6)机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。
6、自动化运维
自动化:简而言之,就是将我们日常手动进行的一些工作通过工具,系统自动来完成,解放我们的双手及枯燥的重复性劳动,例如:没有工具前,我们安装系统需要一台一台裸机安装,如2000台,可能需要10人/10天,搞烂n张光盘,人力成本更大,而现在通过自动化工具,只需几个简单命令就能搞定、还有如机器人类程序,自动完成以往每天人工干预的工作,使其自动完成、汇报结果,并具备一定的专家系统能力,能做一些简单的是/非判断、优化选择等,这些好处非常明显不再多说,应该说,自动化运维是运维工程师职业化的一个追求,利已利公,虽然这是一个异常艰巨的任务:不断变更的业务、不规范化的应用设计、开发模式、网络架构变更、idc变更、规范变动等因素,都可能会对现有自动化系统产生影响,所以需要模块化、接口化、变因参数化等因此,自动化相关工作,是运维工程师的核心重点工作之一,也是价值的体现。
四、总结
综上所述,做一个好的运维工程师,除了具备良好的综合技能水平,还要有一个负责任的工作态度,这也是优秀运维工程师具备的素质。因为对于运维工程师而言,每一次故障的发生都不是小事,很可能会影响公司线上业务的稳定性,甚至直接导致公司的经济损失,所以我认为对待工作中发生的故障以及事件要秉着一个“小事件,大处理”的原则,将发生的故障扼杀到摇篮里,慢慢地积累故障处理经验,这样当真正的大事件来临时,我们可以采取有效的措施及时应对。除了处理好发生的故障事件,我觉得运维工程师还应具备可预见性,故障随时可能发生,如何防患于未然,这将是对我们做好运维工作的一个考验。古人云:“不积跬步无以至千里,不积小流无以成江海”运维之路就是由一次次故障事件中拼接出来的,作为其中的一份子,任重而道远!
运维述职报告篇5
时间过的飞快,转眼间,来xxx一年出头了。这一年来让我感受了很多,经历了很多,学到了很多。
在领导的带领下,在同学们的配合和帮助下,我不断地学习新知识、总结新经验,努力加强着自身的素质和修养,完成了入职至今自己岗位上各项工作任务,简单汇报如下:
一、严以律己
从200x年x月x日加入公司以来,在平时工作中,我始终努力以工作高标准严格要求自己,严格遵守公司的各项规章制度。负责的工作范围跨度从sa到dba再到内网网管。具体工作从前端集群、web服务到中间件服务的维护,到后端两类数据库(mysql/oracle)服务,再到办公室内网改造维护。遇到问题能够做到不等不靠、不推脱责任,以最快的速度去解决问题。适时回报领导进展情况。能够有条不紊地安排完成好各项工作,争取起到在组内的带头作用,能够主动积极和组内领导交换意见,配合支持领导开展部署好各项新工作及临时紧急工作任务。
二、工作四“件”事
a、无条件配合或完成上级或部门领导分配的任何难度工作。如:各种数据库db管理、部署、架构改造优化、mail架构设计及实施、负载均衡部署、内网棘手问题及其它临时紧急任务。 所有问题均比较圆满的一一攻克。
b、做最紧急需要处理的事。如:网站宕机、服务异常。能够做到第一时间(包括休息时间7*24)处理各类网站监控报警(独立部署并维护nagios重要报警服务、代码上线工作)。尽个人所能最大限度的减少了网站意外宕机隐患发生和大大降低了宕机率。
c、做最重要的事。如架构改造中数据库mysql,oracle部署、升级、维护优化,数据及数据库语句入库严格把最后一道关卡。最前端代码平滑上线,测试效率、用户体验。一年来,几乎以0失误率完成了c条中的架构调整mysql数据库改造部署,oracle升级(32位到64位,再到集群架构)及日常数据库维护。开发平滑上线代码,并持续坚持独自加班加点上线代码直到现在。
d、做最不重要却需要做的事。如各种棘手,琐碎、耗时,又不易出成绩的工作。如:加班或深夜处理各种日常临时问题,报警、清理日志,数据,分析数据、恢复数据测试演练。事无大小 均能够做到根据事情的轻重缓急 合理安排时间一一完成处理。并尽全力让相同异常不在重新上演。
三、 缺点与不足
a、和公司高层领导沟通不够多,缺少深层次的沟通和交换意见。
b、和大家沟通或配合帮助大家时方式方法过于直接,导致影响到个别同学。如;语气更委婉些,态度更平和些,方式再好一些。效果就会更好。
c、对本职工作外的一些相关工作,了解的不够,如:对网站程序级别的架构改造及代码业务逻辑等的了解。
四、附1年来若干重要工作事件
1、独立开发上线(或自动上线)代码程序并且每日部署发布代码。
效果:大幅提升了用户体验,大量节省程序测试,发布时间,大幅提升了上线效率,并显著降低了出错率。
2、独立部署并维护及时监控平台nagios。
效果:大大降低了全年的网站宕机率,并在问题有趋势未故障时提前得到了处理。
3、第一次大规模系统架构改造,负责部分前端迁移,负载均衡部署,重点负责所有数据库层(mysql/oracle)数据顺利迁移。
4、oracle 新数据库成功顺利上线,至今稳定高效,前后各种难点问题攻克。及日常备份、维护优化、集群架构设计实施。
5、365*7*24 监控网站故障报警,第一时间紧急处理公司网站各类故障,让问题胎死腹中。效果:保证了网站最大限度持续正常运行。
6、各类工作shell脚本开发。开发程序对数据库慢查询多重分析,开发寄出mail程序。数据库主从延迟,同步监控并开发自动化处理程序,报警到手机。全网服务器日志轮旬,定期脚本清除。网站日志分析ip、pv、爬虫查看,为处理故障提供了重要的数据依据。开发监控网站带宽程序寄出mail给领导......等等。
7、大量支持公司架构组架构设计改造。
8、新邮件服务器成功部署。
9、办公内网成功改造。
10、全网服务器备份方案设计及实施。
11、各种数据库(mysql/oracle)各种备份方案策略,参与定制 负责实施。演练各种灾难恢复并出文档sa组内分享。
12、负责系统安全漏洞扫描,全网外部服务器防火墙部署安全维护。
13、架构改造前后 mysql数据库 日常维护。备份。恢复优化等。
14、php服务器目录及文件权限特殊安全处理,防火墙加强控制。
15、配合架构组下半年的大量和系统相关的支持,改造。
16、lvs负载均衡服务部署使用并讲解。大规模监控平台nagios服务的整体迁移 。脚本监控及相关服务的迁移,休整。
17、支持架构组主站前端inca,zuma部署直到正式上线,随之的大量临时需求,及分用户后平滑上线问题研究解决。
18、办公网网络较大动作平滑改造。原内网ip冲突,上网慢、qq/msn掉线,网银不能登陆等等疑难杂症完全得到解决或显著改善。
19、开发程序将mysql及正式库oracle数据备份全自动恢复到测试库满足开发、测试工作需要,同时,利用开发和测试人员为我们进行了备份数据有效性的测试,大大提高了运维人员的工作效率。
20、sns 项目环境 lvs+tt server lvs负载均衡问题难点攻关。配合部署。
五、每日日常例行固定工作
1、负责每日上线发布代码,上线服务器。根据程序需求改造、开发修改平滑上线部署程序。
2、负责每日数据库(oracle,mysql)程序员提交的开发及维护sql语句检查 更新正式库。oracle,mysql测试及正式数据库维护、备份、恢复故障监控处理等。
3、第一时间(包括非工作时间)处理网站各种重大或可能给用户带来体验的故障问题及潜在的预期故障(分区,内存,url访问故障等)。确保网站7*24提供持续访问。
4、程序员不计其数的日常开发测试支持。并能通过程序开发工具来节省大家的时间,提高沟通解决问题的效率。
5、能够经常主动提出各种潜在问题或者相关问题自己的特别见解 反馈领导或者组内。
近一年来能取得这样的工作成绩,与领导的支持和大家的帮助、配合是分不开的,在此向公司的领导及全体同学们表示衷心的感谢!
以上是我近一年来的思想、工作情况的简单总结,有不全面和不准确甚至错误的地方,请领导批评、指正。以便我在新的一年的工作中,有信心更进一步完善自身。把sa的工作做的更加完善。为公司的大跨步发展添砖加瓦。
公司经历了200x的夯实基础,必将赢来新的飞跃发展。作为公司的一员我非常愿意和公司一起继续努力发展,为共同迎接美好的20xx而努力奋斗。