编译文章——可用性管理指南(一)By AMT 张纯棣本文关键字 文章交付 广告 可用性管理操作指南(一) 编译:AMT 张纯棣 可用性管理介绍 可用性管理流程的目标是确保任何给定的IT服务与按照客户要求的级别所实现的可用性以一种成本节约的方式被提供。 可用性已成为全球经济环境下,高透明电子商务所提供服务的最重要方面之一。人们对24′7小时的服务需求变得越来越强烈。可用性的有无,对客户满意度有着非常深远的影响,甚至可以很快的影响到整个企业的名誉和成功。 影响一个企业IT服务的最主要因素包括,硬件故障,环境问题,人犯的错误等。硬件故障,如电源供给和硬盘损坏等都是我们要考虑的最显著危险。如果服务器的唯一电力供给发生了故障,这可能导致整个IT服务不可用。服务器内安装的双重冗余电力供给可以去除这种危险。从更广阔的一个环境角度,即使整个机房或者数据中心突然停电,电力备份系统可以在短时间内迅速启动一个备份发电机。以上问题的存在都可以称作可用性的风险,而我们所采取的减轻这些风险的行动叫做相应的解决措施。 可用性的风险也在流程和步骤的内部存在,同时也会因为人为的因素而发生。如果一个测试结果很差的变更被引入到了组织内,那么它就会不可避免的阻止用户获得IT服务,那么整个IT服务就会不可用,除非访问权可以恢复。如果生产数据库被因为疏忽被昨晚的备份数据所覆盖,而不是新备份的数据,这可能为可用性带来灾难性的毁灭。采用的措施如仔细检查并发布工作流程,为员工推出合适的员工培训计划等都可以用来帮助我们减小这些风险。 可用性的风险还存在于整个IT基础设施和任何一个管理流程内。尽管可用性管理不会直接对每一个流程负责,可用性管理确可以保证所有影响到可用性、对其带来风险的因素都可以被考虑到,同时,IT基础设施整体架构和支持某个给定IT服务的管理流程成熟度是充分的。 由于IT服务的每一个流程都在努力的削减可用性带来的风险,因此,从这个意义上说,可用性管理和服务连续性管理是联系非常紧密的。可用性管理的主要关注点在于如何处理那些常规的、日常发生的可用性风险。如果直接的解决措施是不可用的,或者某个解决措施成本是很昂贵的,超过了一个IT服务在其权责内可以承受的范围,那么这些可用性风险就被转交到服务连续性管理来解决。 可用性管理不仅仅考虑如何消除一个IT服务的可用性风险。他同时也负责确保即时且有效的采取措施,响应那些受到突发事件影响的服务,同时防止那些不必要的服务请求转交。 除了这些关注于减少计划外宕机时间措施外,可用性管理也需要将注意力集中到在必要的地方减少计划内的宕机时间。计划内的宕机时间如计划的维护时间或引入新功能模块的时间等也会影响可用性,特别是如果这些时间都在已达成的服务协议内。当然,计划内宕机时间需要在此服务协议外安排,不断增加的服务需求对今天的业务可用性提出了24*7的要求,这使得可用性服务提供的难度越来越大,而与此同时,要求计划内宕机时间尽可能减少。 与其他流程的关系 可用性管理是MOF最优化架构中基础性服务管理的功能之一。在此架构中,你要与客户协商服务级别协议的制定,并对IT基础设施实现最优化,执行对IT基础架构的变更请求。下图列出了MOF最优化模型中的组成部分: 图1:微软操作架构最优化模型 服务级别管理 服务级别管理协调并管理服务级别协议(SLAs)和操作级别协议(OLAs),而可用性管理是这两个协议的重要组成部分之一。 从可用性的角度来看,服务级别协议的主要职责是与客户进行交互,并识别出哪一个IT服务对整个公司的生存起到最关键的作用。可用性管理依靠这些优化流程识别出支持这些关键服务的IT基础架构组成部分,同时确定是否这些基础架构组分包含任何单点故障或其他可能对可用性造成破坏的风险存在,并找出一种适当的措施以成本最低的方式消除这些风险。 如果直接的解决措施是不可用的,或者某个解决措施成本是很昂贵的,超过了一个IT服务在其权责内可以承受的范围,那么这些可用性风险就被转交到服务连续性管理来解决。 财务管理 财务管理在整个组织中的作用就像一个过滤器;一方面,他保证了可用性管理、能力管理或服务连续性管理提出的解决方案可以根据他们实施时的成本与为客户产生的效益来调整;另一方面,财务管理监控、控制,并在必要的时候补偿IT组织所遭受的损失。 员工管理 无论组织在何时向其所在的IT环境中引入一个新技术,将要使用这些技术的人必须接受适当的培训和激励。员工管理确保组织内的成员接受正确的培训,并做好操作一个新的解决方案的准备。 服务连续性管理 可用性管理和服务连续性管理是紧密相连的两个流程,他们共同作用以消除可能对IT服务可用性造成的风险。然而两者确有不同,首先,可用性管理的关注点在于如何处理日常的可用性风险,特别是那些每天都可能发生的风险,如一个硬件发生了故障等等。服务连续性管理则偏向于那些特别严重或者是相对罕见的服务可用性风险,如火灾或水灾等等。 如果直接的解决措施是不可用的,或者某个解决措施成本是很昂贵的,超过了一个IT服务在其权责内可以承受的范围,那么这些可用性风险就被转交到服务连续性管理来解决。 能力管理 能力管理通过对额外资源的规划确保满足客户需求的合适IT资源是可用的,因为宕前 系统资源的使用是从近乎完全的可用性点开始的。可用性管理与本流程有着非常紧密的联系,因为如果想要以最有效、最节约的方式满足业务绩效水平,对IT资源的最优使用就需要与有效的可用性管理相挂钩。可用性报告与衡量措施显示了能力或绩效问题所代表的可用性趋势。 变更管理 可用性管理关心对用户的IT计算环境可用性和可靠性的变更请求。变更请求评估流程必须与变更协调员进行合作,才能产生对IT环境所要求的可用性和可靠性变更实施效果。变更管理功能的质量对可用性会产生直接的影响。对超出协议服务级别目标的计划内维护活动所占比例的报告是非常重要的,同时也要包含在服务级别目标(SLO)中或正规的记录在操作级别协议或服务级别协议中。 角色和职责 这一部分列出了正确实施可用性管理流程时的角色和职责。值得注意的是,这里列出的是角色,不是工作描述。一个小型的组织中可能有一个人扮演多个角色,同时在一个大型的组织中,可能由一个团队共同扮演一个角色(如,一个可用性管理部门)。在后面这个例子中,会有一个团队的人执行由可用性经理指派的任务。 建议在所有的例子中安排一个人员来负责实施流程,并在流程执行受阻时解决问题,使流程畅通。而这个负责人就是可用性经理。 可用性经理 可用性经理负责管理可用性管理流程的各个活动。这个人要负责保证任何给定的IT服务都按照与客户达成的协议级别交付,同时他要与其他的管理流程进行协调,以完成这一目标。这一角色也是MOF团队模型中所规定的基础设施角色簇的一部分。 可用性经理由许多任务,包括: -
确保客户需求正确的被转化为现实中的可用性目标 -
保证适当的IT预算保护服务的完成 -
监督可用性设计和恢复设计的规划活动 -
确保可用性的所有风险都被识别,并能恰当的处理 -
承担可用性建模的工作,以帮助识别出最有效的解决措施,评估未来变更所带来的影响,并识别潜在的改进之处 -
在需要的地方实施成本节约的解决措施,弥补单点故障的损失 -
确保识别出客户需求和服务连续性管理最终递交服务之间的差距 -
保证整个IT基础架构足够成熟,以支持可用性需求 -
定义可用性监督流程和工具的需求,以支持该流程的实施 -
保证公司内部和外部的可用性目标在适当的服务级别协议中体现 -
管理日常的可用性服务需求 -
站在客户的立场上收集并评估可用性评价指标 -
预测未来可用性需求的影响度 -
参与变更咨询委员会,评价建议的业务和基础架构变更的可用性影响度 -
管理一个连续的可用性改善流程 -
为评估并签订包含可用性条款的任何外部合同提供咨询服务
如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐 jill.jiang@amteam.org | 021-51096826-112 | 在线联系 |
|
|
|