AdvancedITIL: eBook Archives
ITIL 的目标
故障管理目标
第 2 章
ITIL 出版物“服务支持”中定义的 ITIL“故障管理”目标如下:
“故障管理”的目标就是将 IT 基础设施内的错误引起的事故和问题对业务的负面影响减到最小,并防止与这些错误相关的事故再度发生。为了实现这个目标,“故障管理”力求找到引发事故的根源,然后才着手改善或纠正该情况。
“故障管理”流程具有被动和主动两个方面。被动方面是作为对一个或多个事故的反应而解决问题。主动“故障管理”是指在事故发生前确定并解决问题和已知错误。
现在我们将该定义分解成几个基本组成部分,然后看看是否可以找出有助于证明实施 ITIL 必要性的内容:
“将事故和问题对业务的负面影响减到最小并将事故和问题出现的频率降到最低”:这是一个争议的焦点,因为 IT 部门惯于将重心放在性能而不是质量上,放在提供支持而不是消除问题上。例如,服务台通常在首次接到电话时就设定了性能目标,如严重事故的解决,但他们并未对减少事故设定目标。其结果就是服务台在首次接到电话时挑简单的事故进行处理,而不是设法减少发生潜在事故的次数。这会导致客户遭受延迟和挫折,以及致使服务台人浮于事。
确定是否有通过“故障管理”减少事故发生次数的明确目标。如果没有,则找出在过去一段时间(比如一年)内事故发生的次数减少的原因。对于“故障管理”,还没有目标事故降低率的行业标准。但是,最常引用的是 30% 到 70% 的比例。如果您的公司内没有可以反映“故障管理”效果的数据,那就用服务台开销的 30% 作为潜在的开销节约比例。
“着手改善或纠正情况”:将要采取的措施包括“解决方案”或“遍历操作”,这是服务台快速处理事故所必需的。还包括长期消除源自基础设施的错误和事件的必要措施。首先,我们看一下解决方案。您的服务台和二级支持小组能否对解决方案做了明确说明?他们在确定解决方案后能否立即对其进行传达?他们是将信息输入到支持数据库中还是输入到您的知识管理信息库中?如果对上述任一问题的回答是否定的,那么您很可能并未开始着手纠正各种情况。
在许多公司中,只有在作为支持和维护客户的唯一途径时,才会应用长期解决方案。在大多数情况下,如果在接到第一次电话后问题就可以由服务台迅速解决,那就不会努力去寻找长期解决方案。(这是高度集中处理首次打进的电话的直接结果。)您是否要执行“故障管理”并调查所有事故以确定长期解决方案?如果不是,请在您的服务台数据中查找最频繁发生的事故,并估算消除这些事故所带来的收益。这为您制定 ITIL“故障管理”方案提供了更多的信息。
“找到引发事故的根源”:此“故障管理”的目标要素与前面的目标要素是密切相关的。真正的“故障管理”来自确定问题的根源,然后确定消除该问题的开销与从中得到的收益或节约效果相比是否划算。有时让服务台继续处理发生的事故比消除该问题的开销还要少一些。人们常会误解问题的根源。例如,根据 Help Desk Institute 的调查,在服务台遇到的所有事故的 30% 到 50% 都是询问如何操作。在这些事故中,技术是可行的,但缺乏知识。服务台常会创建知识库或 FAQ 以解决这些问题。问题的根源在于客户缺少培训,而这正是作出努力和投入资金的方向。
努力确定您当前是否正在查找所有事故/问题的根源,以及是否正在做出根除这些事故/问题的合理的业务决定。如果不是,请执行前面目标要素中所描述的操作。另外,如果您出于合理的业务原因允许在系统中出现错误,那么您务必要完整地记录该解决方案。
“防止事故再度发生”:这也与前面的目标要素密切相关,但此处的主要因素是时机的选择和如何作出决定。首先,您是否具有一个无论何时何地都应该减少事故的策略?如果没有,那您就有理由实施 ITIL“故障管理”了。其次,您何时决定减少事故?您是寻求在第一次发生事故时就将其彻底消除,还是等到事故多得无法应付时再将其彻底消除呢?如果您并未关注每个新的事故,说明您还没有进行有效的“故障管理”。
“既被动又主动”:许多公司执行被动的“故障管理”,而只有少数公司执行主动的“故障管理”。本节前面提到的每个要素都是针对被动“故障管理”的,也就是说事故发生后我们再进行处理。很少有公司进行主动的“故障管理”,如通过复查/分析事故数据库,或者复查所有的变更或新增系统,以防止因此发生事故。您是否对事故数据库进行分析以确定将减少事故发生次数的趋势?如果不是,那么您应该将其作为一个需要进行“故障管理”的理由,利用“故障管理”还会提高客户服务质量。如果您确实对变更和新增系统进行复查,那就要看一下最近出故障的或者引发新事故的变更/新增系统。然后,通过估算在得到成功执行的情况下可以节省多少时间和金钱来得出支持的证据。
“故障管理”在大多数 IT 部门中一般不会得到重视,而可从中获得最高回报的 ITIL 作用却会受到重视。所以要将此处所描述的目标看作是冷酷无情的,并制定一个有力的“故障管理”方案。
> > 第 3 章 - 变更管理目标