摘要:项目管理者联盟 不管是供应商还是用户,最棘手的事情莫过于系统故障的发生,这时,所有的压力都在IT人员身上,领导的关注、项目的工期、甚至能否顺利回款,都要看这些故障能否及时快速的解决。项目管理者联盟 本文根据笔者多年的工作体会,从心理、责任、沟通、求源、知识结构等多方面,将故障分析过程中需要注意的问题,进行总结归纳,与广大IT技术人员分享。training.mypm.net 项目管理者联盟 1. 前言项目管理者联盟 任何计算机系统都有出现故障的时候,可能发生在试运行的阶段,也可能发生在系统正式运行后,还可能发生在已经稳定运行很多年的系统上,又可能发生在系统一个小小的升级后。同时,系统故障带来的负面影响可大可小,大到整个系统瘫痪,所有业务不能办理,所有营业网点全部停业;小到仅仅是某一台终端的某一笔业务不能正常完成。转自项目管理者联盟 项目管理者联盟 系统出现故障,就必须分析故障原因,并尽快的采取措施排除故障。一般来说,故障分析的难度与故障带来的负面影响不成直接的比例关系,整个系统瘫痪的原因可能在1分钟内得出:中心机房停电;某一笔业务不能正常完成的原因可能需要分析一天甚至若干周:在长达5万行的程序中有一个底层函数的一个输入参数少了一位的长度。与故障分析的难度成正比的,是系统的复杂度,这里指的复杂不是指设备的数量和软件的长度,而是指系统中设备的种类、软件的种类、涉及的厂商的数量。系统越复杂,涉及的设备、软件、厂家、人员就越多,可能带来的故障分析难度也就越大。项目管理者联盟 service.mypm.net 以Callcenter系统为例,它不仅仅包括计算机系统,还包括电话交换系统,其中设备、软件的种类繁多,技术复杂,包括:PBX设备、小型机设备、网络设备、存储设备、7号信令、CTI中间件、IVR中间件、交易中间件、WEB中间件、数据库软件以及C++/DELPHI/JAVA等编程语言,所涉及的供应商、合作伙伴、相关业务系统也比一般系统复杂。因此,类似这样的高复杂度系统,其故障的分析、排除就具有相当的难度。service.mypm.net 项目管理论坛 系统故障的快速排除,需要企业有一套完整有效的协调机制和流程。现在,大多数有着严格质量管理体系的IT企业,都制订了自己的重大故障处理流程,故障分析就是其中的一个环节,也是最关键的环节。但是,由于故障分析本身涉及到更多的是技术细节和相关人员的综合能力,在流程之外,故障分析本身,又确实有其内在规律需要技术人员注意。项目管理者联盟 service.mypm.net 本文根据笔者多年的工作体会,将故障分析过程中需要注意的问题进行总结归纳,与广大IT技术人员分享,希望能给读者一定的帮助。项目管理者联盟 blog.mypm.net 2. 必要的心理准备PgMp.mypm.net 项目管理者联盟 2.1. 故障,总是会发生的,就算你全测试过。PgMp.mypm.net 项目经理博客 软件工程师大多都是心地善良、充满自信的,在系统开发、测试的时候兢兢业业,一丝不苟,完全通过后,就放心的认为自己的系统已经固若金汤了。当系统发生故障以后,就觉得不能接受这样的现实,“怎么可能出错啊?不可能的!”,一旦确认系统出错后,又会很愧疚,“哎,怎么这么仔细还会出错啊?”,在心里产生挫折感。项目管理论坛 项目管理者联盟 其实,这两种心态都大可不必。复杂的软件系统,不管你代码质量多高,测试多完善,理论上,出错的可能总是存在的。出现故障了就尽快确认,接受这个现实,然后,不用多想什么,快速分析,排除故障,用户会理解你,甚至会感谢你。让用户感到烦的是出了错死活不承认,面对证据不能抵赖了,又束手无策的那种人。因此,最关键的是你要有这样的心里准备和能力准备,如果盲目的自信而且毫无准备,那到时候就难看了。service.mypm.net 项目管理者联盟 2.2. 故障,总是有原因的,就算你不知道。training.mypm.net 项目管理者联盟 计算机业务系统是高度逻辑的集合,任何操作都有其前因后果,故障只要发生了,那就有其发生的原因。有时候,遇到故障,我们会苦闷:“没有道理?”,“莫名其妙?”,说这些都不能说明系统错误是无缘无故发生的,而只能说明原因可能暂时还不知道,只要有错误发生,我们就必须进行故障分析。故障发生了,是不能否认的,你肩负责任,也是不可推卸的,说出这样的话,只能表明“没有道理”的,不是计算机系统,而是你自己。项目管理者联盟
2.3. 故障,总是需要你保持理智的头脑。service.mypm.net 项目管理者联盟 解决故障的过程中,充满了各式各样的斗争,不管发生了什么意外的情况,遇到了多么怒火冲天的用户,多么顽固不化、固执己见的工程师,多么傲慢的厂商技术支持,做为解决故障负责人的你,都要时刻保持理智,冷静的控制你的情绪,千万不能情绪失控。 项目管理者联盟 因为,在愤怒的状态下,人的思维总是缺乏逻辑的,一旦失去了理智,你会说一些不该说的话,做一些不该做的事。而你的目标是什么,是解决问题,但吵架只会使问题更复杂,使以后的配合、沟通更不顺畅,这样无疑是加大了解决问题的难度。所以,无论如何,请不要让自己失控,而且,也没有必要发火,无论多么棘手的问题,总会解决的。bbs.mypm.net 项目管理培训 2.4. 故障,总是能排除的,只要你努力去做。talent.mypm.net 项目管理者联盟 “实在是莫名其妙”,“真是搞不懂”,在想到的各种可能都排除了之后,你仍然找不到原因,往往郁闷其中,觉得山穷水尽了,自己无能为力了,想放弃了。这个时候,千万要挺住,要有信心,相信计算机的逻辑性,相信自己的分析,第101种可能或许就是问题的答案。在这个时候,不要急躁,总结一下,再回头对问题仔细分析一遍,多一次思考就多一条思路,就离解决问题前进一步,再多想想,就会“柳暗花明”了。项目管理者联盟 blog.mypm.net 3. 敢于负责的态度项目管理者联盟文章 项目管理培训 3.1. 故障,总是掩盖不了的,如果你不作分析,仅仅想掩盖。项目管理者联盟 项目经理博客 故障发生的时候,碰巧知道的人不多,心里害怕,你不敢告诉其他人,也不上报,甚至就作了点简单处理就算完了,祈祷“千万不要再发生了,这事就这么过去吧!”,这是不可能的。故障就是故障,只要具备条件,还是会出现的,想让故障不再发生,最好的办法是分析排除,靠遮遮掩掩,没门儿。club.mypm.net 项目管理者联盟 3.2. 故障,总是会再发生的,如果你不排除。项目经理圈子 项目经理博客 故障既然发生了,就必须尽快排除,即便暂时不知道为什么,也得牢记在心,有件事情还没有做完。千万不能存在半点儿侥幸心理,看几天过去了,没有再发生,就谢天谢地,以为事情过去了,那你就错了,指不定哪天,可能就在业务最繁忙的那天,又给你来一下,那时,就没有人给你好气了。用户可不是好惹的,在一在二不在三四,重复发生了这么多次了,你想干嘛?项目管理者联盟 talent.mypm.net 3.3. 故障,总有可能由你造成,如果没有确凿证据。项目管理者联盟 项目管理者联盟 系统复杂了,分工多了,各司其职。出故障的时候,总有牛人在第一时间跳出来,“这个跟我没有关系,我这里不可能出错… 在别的系统中,我们的产品就从来没有…”。可最后的事实呢,大家都查不出来,最后还是他的问题。在出现问题的时候,不能盲目的把自己排除在外,事不关己,仍然要静下心来,好好分析,不管分析的结果如何,即使确实不是你的错误,也算为解决问题消除了一种可能,对整个问题的解决也是有益的。项目管理者联盟
本文为项目管理者联盟联盟会员原创文章,授权发布,非经同意不得转载!
|