编译文章——可用性管理指南(二)By AMT 张纯棣

2006-4-25 22:19:04【作者】 畅享网 【进入论坛】
本文关键字 文章交付
广告

可用性管理操作指南(二)

 

编译:AMT 张纯棣

 

可用性管理流程

尽管整个任务中的大部分流程都是相似的,可用性管理流程着重关注两个不同的领域。第一个关注点是一个包含全部需求定义和设计阶段的崭新的IT服务。第二个则是那些可能需要明显的短期努力以提高可用性级别的现有IT服务。

 

新的IT服务

新的IT服务可以为以最节约的方式来实现可用性目标提供最佳的机会,因为它可以在早期阶段考虑可用性。它允许选择最适当的技术并设定一个IT支持基础架构,以提供所需的操作成熟度级别。

 

用户与IT组织在这样的情况下有机会进行紧密的合作,特别是在定义IT服务提供得可用性级别以及达成所需的投资级别协议时更是如此。它避免了未来可能出现的过高期望,并能在早期解决所需投资和可用性级别之间的错误匹配问题。

 

 

新的IT服务目标就是在第一天就实现所需的可用性目标,并成功管理整个解决方案生命周期中的可用性级别,特别是在按照当今快速变化的业务环境引入功能或技术上的变更时,这一作用更为明显。

 

现有的IT服务

现有的IT服务也可以将其可用性级别进行显著提高,或者在采用一个规范的可用性管理流程中进行标准化;同时,可以在进行中的连续改进流程以及对未来变更的仔细管理中获得收益。

 

现有IT服务的存在的问题是,他们经常遇到设计上的限制和技术挑战,对这些问题的克服可能会产生较大的成本。这就是为什么从一开始便实施可用性管理是如此重要的原因。

 

生命周期法与新的IT服务很相似,他们以与客户协商的可用性定义开始,制定一个合适的改进预算计划和持续维护计划,从而根据宕机成本调整维护时间。

在某些方面,现有IT服务比新的IT服务更有优势,因为他们有服务提供的跟踪记录,这些记录可以从细节上检查任何缺陷和暴露出来的问题。可用性设计流程包括对客户所经历的服务损耗历史记录进行调查,并作出适当的根源分析。

 

在任何时候,可用性管理经理的角色不可避免的包括对现有IT服务的改进,同时也要引入新的IT服务。另外,对现有IT服务引入主要的变更,如从一个技术平台升级到另一个等活动也需要这两个角色的混合。但所遵从的基本流程是类似的。

 

定义服务级别目标

根据所处的语境不同、用法不同、用户解释的方式不同等等,“可用性”以及“高可用性”这两个术语可以有多种不同的解释方式。他们可以被用来描述一个更广泛的业务目标和技术需求,同时从一个相对容易实现的硬件方面——仅仅是可用性目标,来表述;或一个要求非常严格的关键任务目标角度等,无论何种角度,都可以适用于对整个IT服务可用性的描述。

 

所以,我们在设置可用性目标时,常常做出不合适的预期。同时,一旦成本的影响力和效果被客户掌握,他们就很容易提出比其当前愿意支付的可用性级别更高的可用性请求。可用性管理通常以与客户认真协商并达成的可用性目标开始,随后对宕机的成本以及IT服务的不可用性进行分析,从而确定最现实的IT预算目标。

 

这一流程包括了对双方进行教育和谈判的步骤,因为客户需要了解如何定义并阐明自己的可用性需求。而IT组织需要了解不同客户的功能,从而确定出整个IT服务的雏形,并找出最关键的服务。对服务级别目标进行谈判的步骤在服务级别管理流程中进行了定义。

 

定义关键客户功能

任何给定的IT服务通常包括多个客户功能或交易,同时某些功能可能拥有一些不同的可用性需求,对业务也会产生不同的影响。组成整个IT服务的每个主要的业务功能或交易需要按照其重要性进行定义和排列,这样最重要、最关键的元素就会被单列出,获得特别的关注。

 

在重要服务和任何相关的但不重要服务之间,相互的关系也需要被仔细的定义。例如,一个新的关键电话处理系统可能很强烈的依赖于IT基础设施内其它部分所提公的文档和打印服务,它同时也需要存档和打印服务根据需要及时更新。

 

定义可用性目标

IT服务的可用性是一个复杂的问题,它包括许多原则和规范。有许多方法可以用来提供必须的IT服务可用性,每种方法都有其成本适用性。

 

然而,与其完全相反的是,可用性目标通常由用户使用很简单的术语来表示,并且不需要彻底了解这些目标的成本适用性。这样往往导致客户和IT组织之间对于某些问题的误解,尤其是投资级别的不适当选择,从而最终导致了客户的不满意。

 

一个被认为实现了99.5%可用性的需求可能完全与另一个对99.5的可用性需求完全不同。一个要求可能讨论了硬件平台自己的可用性,而其它的需求则可能是端对端的完整服务。即便是对于一个完整的端对端服务的定义,也可能有很大的不同;因此,了解所有可用性需求的衡量方式是非常重要的。比如,考虑以下情况:

-          如果在主服务器上的所有硬件和软件都运转正常,而用户连接也已准备就绪,被应用所接受,那么这样的解决方案便可被认为是具有100%可用的。

-          如果有100名用户,但由于局域网的故障,其中有25%的用户无法连接,这样的解决方案仍被认为是100%可用的吗?

-          如果100名用户中只有一个用户能够连接,并进行工作,这样的情况是否属于仅有1%的可用性呢?

-          如果全部100名用户能连接,但服务被降级到只有三分之二的用户交易可用,或者说,系统地性能非常差,在这种情况下,如何影响可用性的度量呢?

 

可用性将被度量的周期也会对可用性定义产生影响。要求在一年内提供99.9%可用性的服务请求,实际上仅允许8.8小时的宕机时间。要求在四周内提供99.9%的可用性,则意味着每周只能有40分钟的宕机时间。

 

客户可以使用自己的术语来定义可用性。可用性管理经理应该注意培养并确保所有的用户都了解这些术语,并保证最终的结果是可以实现的。如果客户背允许有自行决定可用性衡量的条件,那么他们将对结果承担更多的责任。

 

识别并讨论计划内维护活动、技术升级以及引入新的业务功能等时间也是非常重要的。用户接受的计划内宕机时间再一次的将对用户的可用性需求产生影响。

 

建议的可用性解决方案

既然一个IT服务内,对于关键业务功能的可用性目标已被识别出来,而他们相关的重要性和财务影响度也已被用户完全掌握,那么下一步的任务就落实到如果设计整个IT架构,以提供用户所需要的可用性级别。

 

整体的设计流程和传统的开发方法不大相同。可用性管理是MOF优化阶段的一部分。他对规划、建设以及引入IT解决方案不负主要责任。这一角色需要在整个微软解决方案框架(Microsoft Solutions FrameworkMSF)内完成。可用性管理负责设计与需求和标准相关的适当可用性,从而通过MSF可以管理一个规范的项目,并确保IT服务按序搭建。

 

可用性设计流程通常包括一系列的反复流程,从上述需求定义阶段到分析和设计阶段,不断重复。可用性的目标和预算约束定义在需求阶段内完成,同时需要与客户进行反复的讨论,方可完全确定。

 

可用性设计流程的第一步是涉及主要的IT技术组分,架构、参与人员和流程,这些部分都支持着一个完整的端对端服务提供的完成,并属于关键业务功能和被保护事务的一部分。

每个组成部分的完整生命周期可以从细节上进行进一步的分析,主要目标是涉及一个高可用的IT基础架构和支持环境。主要有两个主要的设计流程,用来负责设计可用性和恢复程序。

 

可用性设计可被看作揖个主动的活动,该活动关注如何使IT服务不断的进行,并组织服务发生中断,降低对所提供服务产生的故障和影响。

 

恢复程序的设计主要是一个被动的活动,主要是侦测、诊断并在故障或一些服务质量下降真正发生的时候尽快恢复服务。

 

如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐
jill.jiang@amteam.org | 021-51096826-112 | 在线联系
IDS  Scheer专栏ARIS在业务流程架构设计中的应..

企业需要建立一套适合自身实际情况,并保持适当前瞻的流程层次管理结构与分类体系,即企业业务流程架构设计……

吴勇毅 专栏CIO 应向刘邦学管理

而国内不少专家也认为,“七分管理,三分技术”,CIO优良与否,与技术出身有关,更与整体素质有关。

SaaS市场分析师-李瑞祥专栏联盟将为SaaS厂商构建成熟生态..

SaaS厂商发展战略联盟将增强厂商在SaaS产业价值链上的竞争优势,把联盟对厂商的价值分解为价值创造……

北自所 专栏ERP实施顾问角色转变与项目把控

在这30年中随着ERP的不断发展,ERP实施顾问的角色也逐渐实现了从保姆式实施到导师式实施的转型。