BCM业务连续管理 激活数据存储的“心脏”本文关键字 转贴文档 广告 BCM业务连续管理 激活数据存储的“心脏” 作者: 李泓 侯海波 保护数据最原始的方式是存储与备份。数据是企业的心脏,能让心脏跳动起来的是业务。一直以来,人们用存储与备份的方式保护数据,后来发现,保护能让心脏活跃起来的业务才是实质。 业务连续性管理(Business Continuity Management,BCM)就是这样一个激活心脏的战略。 企业实施BCM,就是要构建一个有效应对危机的管理体系,使危机管理科学化、手段现代化。BCM需要考虑到企业员工、业务流程、企业流程、法律问题等问题,当然也包括如何保证IT系统的正常运行。 和传统的危机应对策略不同,BCM是在当前企业对信息技术十分依赖的背景下提出的,充分考虑了危机来临时,恢复信息系统的重要性和特殊性。 同时,BCM不仅仅是单纯的技术行为,其目的是最终实现政府部门和企业的业务的持续运行,而单纯的灾难恢复技术,通常以信息系统的恢复和正常运行为目标。 现代企业能否在突发性灾难的影响下依然保障业务的持续运行,已经关系到企业的成败。BCM已经成为现代企业应对危机事件的国际通用规则。 缘何BCM? 因为风险渐大 随着社会信息化的发展,现代企业的正常运作越来越依赖于其信息系统的安全运行。然而,信息系统本身的复杂性使其自身的脆弱性大大增强。由于信息系统的失效,造成业务数据丢失、业务系统中断的实例正逐年递增。 影响企业信息系统和业务存亡的威胁很多,通常包括:自然风险(例如地震、火灾、 水灾、气象、疾病、战争等)、人为风险(例如对系统的错误操作、黑客攻击、病毒发作、员工发泄不满等)、技术类风险(例如设备失效、软件错误、通讯中断、电力失效)等方面。 国外一项权威调查显示,20%的企业平均每五年就会遇到一些影响公司运营的意外情况。事实上,美国“9·11”事件、“非典”疫情、印度洋海啸、莫斯科大停电、伦敦地铁爆炸等事件都在提醒我们,现代企业面临的风险环境非常严峻。 另外,普通的断电、缺水、火灾或者交通问题,都有可能影响某个组织的客户服务能力,以及企业的持续经营。 因为损失剧增 灾难带来的首先是财务损失。关键业务人员的牺牲、物理资产的损坏、业务数据的丢失,都会带来直接的财产损失。 另外,损失还包括收入减少、法律赔偿、股票损失、恢复业务附加的花费、恢复工作所增加的费用等等。其他需要考虑的重大损失可能还有员工的士气 、公众对企业的信心、公司的形象 、金融信誉,以及其他不可量化评估的损失等。 实际上,灾难造成的后果往往是无法用金钱来衡量的。由于现代企业对信息技术的高度依赖,灾难造成的后果往往会关系到企业的生死存亡。 根据权威统计数据显示,美国在近10年间遭遇过灾难事件的企业中,有55%的企业马上倒闭,因为数据丢失造成业务无法持续,又有29%的企业在两年之内倒闭;真正生存下来的企业仅占16%左右。 国际权威调查公司Gartner Group的数据也表明,在经历大型灾难事件而导致系统停运的企业中,有2/5左右再也没有恢复运营,剩下的公司中也有接近1/3在两年内破产。 因为策略落伍 世界各国的实践表明,在企业关键业务的正常运作高度依赖信息技术的今天,如果不充分考虑到信息系统灾难恢复的特殊性和重要性,传统的业务管理方法及流程往往无法满足业务持续运作的需要,甚至导致业务永久无法恢复,给企业带来灭顶之灾。 当然,企业可以选择购买保险,降低一部分灾难损失。但是,保险不能挽救所有的损失。例如保险无法找回企业丢失的重要顾客信息和关键的业务数据,而这些重要的资产,往往是业务持续运行所必须的。 传统的信息安全技术无法抵御大的灾难风险,而灾难恢复技术往往从技术的角度出发,仅仅保证信息系统的快速恢复和重新运行。虽然这些手段都是业务持续运行所必需的,但无法从更高的业务系统层次上保证业务的快速恢复和持续运行。 因为企业生存 企业实施业务连续性,首先来自于客户和市场的压力。服务于全球客户的复杂性,以及消费者的高期望值,让企业保持业务永续的状态是当务之急。 据介绍,是否拥有应对灾难事件的业务连续性计划、是否引入有效的BCM机制,已经成为一些发达国家政府机构与企业选择合作伙伴的一个必要条件。 在英国,拥有行之有效的BCP计划,已成为企业上市的基本要求;在美国,企业法对BCM的具体措施也有明确要求;在亚洲的新加坡,已经拥有多个保证业务连续性的标准流程和管理规范。 可以预见,实施BCM会成为未来企业应该遵守的法律准则。 因为BCM是战略 由于BCM的出发点是保证企业关键业务的不间断运行,以满足企业符合法令以及客户服务水平需求,因此,BCM的规划和实施不仅仅是IT部门的事务。 制定和实施BCM战略需要企业各部门的协调,需要在企业整体业务和IT架构下进行整体分析和评估,并在业务成效和总体拥有成本之间谋求平衡,因此,BCM是企业高度的战略。 企业应该从战略管理的高度制定业务持续计划,实施BCM,以作为企业应对灾难、保证业务不间断运行的基础策略。 目前,国际上已经有了成型的BCM标准规范。尤其“9·11”事件后,美国政府更是大大加强了BCM机制的建设,其他各国政府也日益重视,亚太地区的BCM机制正在逐渐形成。 据Meta预测,在全球大型企业中,用于业务连续性计划的投入将会持续上升,到2007年,这笔投入将从现在的占IT预算4%提高到7%。 相比之下,我国BCM还只是刚刚起步,与国外存在着较大差距。大部分企业还没有建立完整的BCM机制。 根据国内权威机构的统计数据,目前,在应对危机事件时,90%以上的中国企业存在明显的漏洞,企业对BCM专业知识的普及程度远远不够,专业人士还十分匮乏。 搭建BCM的四块积木 BCM,更倾向于建立风险的应急管理机制,而不仅仅是灾难恢复的实现技术。就这一点而言,在业务连续性方面,国内大部分企业只完成了其中部分要素的建设。 例如,某公司非常重视灾难恢复设施的建设,花费巨大投资建设了灾难恢复的后备中心,后备设备和技术方案也非常完善。当生产场地的主机、网络等设备遭到破坏时,主要的应用系统可以快速地切换到后备中心继续运行。 实际上,当大的灾难发生后,虽然该IT系统得到及时的恢复,但由于缺乏业务层面的考虑,前台员工的办公场所、开展业务的必要设备(包括打印业务凭证需要的打印机、印章等)无法落实,员工无法实现应急办公,最终会导致业务长时间的停顿和巨大的业务停顿损失,在IT系统上的巨额投资没有起到应有的作用。 在上面的例子中,灾难恢复设施的建设只是实现业务连续性的一个要素,如果不能从全面的角度考虑,实施业务连续性管理的结果只能是事倍功半。 实际上,企业实施BCM,应该从战略管理的高度,关注如下四个要素(俗称4P要素):流程(Process)、人员(People)、设施(Product)和计划(Plan)。可以说,实施BCM的四个要素就是搭建BCM的四块积木。这四块积木分别解决了在应对灾难危机时,什么人(或组织)按照什么样的流程操作什么样的资源,而计划正是规范以上要素的文档体现。 当灾难发生,业务受到威胁时,通常需要采取一系列关键步骤,及时恢复系统、数据和业务,以减少损失。这些措施包括以下几点。 ◆ 应急反应:主要指明在灾难发生的第一时间我们应该采取的紧急行动。例如,怎样发现灾难,怎样向上级有关领导报告,怎样进行人员紧急疏散,怎样召集相关人员进行紧急操作,以减少进一步损失等。 ◆ 评估:主要是为了确定灾难的严重程度,以确定下一步的行动和决策,例如,根据灾难对信息系统的影响,确定是否需要启动后备中心等等。 ◆ 通告:根据评估和决策的结果,按照预先确定的通告条件,正式发出灾难宣告,并通知相应的各有关部门。 ◆ 业务接续:在灾难备份中心进行数据、应用系统、网络系统等恢复的同时,落实员工办公场地和办公关键资源,以实现关键业务的重新运行。 ◆ 过渡期处理:包括完成业务接续后、生产现场恢复前,在后备中心为保持业务连续性所要做的一系列活动。例如工作秩序的维护、后勤的保障等等。 ◆ 恢复正常:生产现场恢复完成后,过渡期结束,将后备中心的应用、网络、数据重新切换回生产现场,当然也包括工作人员工作场所的回迁。 当然,对不同的灾难、不同的恢复目标以及不同的恢复环境,BCM的流程不是一成不变的,需要根据实际情况进行调整和决策。 第二块积木:团队(People) 人员是BCM流程的执行主体和关键因素。合理的分工、人选和职责定义有助于BCM的顺利进行。 在应急恢复流程中,可能涉及的人员组成包括领导小组成员、灾难恢复功能操作小组、外部联系人员、恢复工作设施联系人员、保险公司代理人等等。需要注意的是,涉及到的人员不仅仅是公司的内部人员。 各小组成员的选择非常关键。不仅要考虑员工的知识和技能,还要考虑员工的经验、性格、家庭住所等因素。一般来讲,应急小组的负责人还应该具有保持冷静和具有创造性的思维能力。 人选的确定需要和人力资源部、业务部门经理、技术部门经理一起协商。对BCM人选,要进行不断的维护。例如,检查人员是否在职,是否需要技能培训,以及联系方式是否需要变更等等。 第三块积木:设施(Product) 在BCM模型中的Product,代表BCM中需要构建的信息系统基础设施和业务持续的相关资源,这些资源是BCM的基础物理保证。在BCM过程中,BCM人员按照一定的流程操作和应用这些基础设施,才能保证数据的安全。 通常,BCM设施包括场地和设备以及其他必要的辅助设施。 ◆ 场地:灾难发生时能够恢复系统应用、关键数据、业务人员办公的场所,通常称为灾难恢复中心。这个中心需要离生产中心有足够的距离,要能够保证电源等基本条件。 灾难恢复中心可以由企业自己构建,也可以选择由第三方提供的商业场地。另外,企业可能还需要单独的场地,以提供应急指挥、发布信息等功能。 ◆ 设备:包括能够保证数据恢复和业务运行的信息系统基础设施,比如服务器、网络设备、通信设备等,这些是BCM的关键设备。 另外,选择场地和设备与企业确定的BCM策略和技术有关,场地和设备是BCM策略和技术的具体体现。设计和选择合理的架构方案,需要满足可用、高效、安全、经济等设计原则。 第四块积木:计划(Plan) 为了规范BCM的流程、规范BCM人员的职责,需要制定BCM计划。 BCM计划就是将企业制定的BCM策略具体化和规范化。BCM计划是企业BCM策略的体现,它的核心内容就是描述和规范BCM的流程、团队、定义相关资源。一个完整的BCM计划应该包含的内容大致如下。 ◆ 目标和范围:表明灾难恢复的目标。例如恢复那些关键业务,恢复时间目标(RTO)和恢复点目标(RPO)分别是多少,同时说明本计划的作用范围。 ◆ 组织和职责:描述参与灾难恢复的组织结构,以及各个岗位的职责描述和人员名单。 ◆ 联络与通讯:详细列出参与灾难恢复相关人员和组织的联系方式,以备应急通讯和联络。 ◆ 紧急响应流程:描述灾难预警机制和主要的应急活动,包括灾难的发现和报告、人员疏散、紧急处理、灾害评估、灾难宣告等等。 ◆ 恢复及重续运行流程:描述业务(包括IT系统)切换到后备中心的主要步骤和顺序,并描述如何在后备中心持续运作,以及如何在生产现场重建后回迁等过程。 ◆ 保障条件:实现业务接续需要的技术、通信等资源保障。 ◆ 附录:本计划实施需要的其他资料和说明。 雕塑BCM BCM就是在对企业进行业务冲击分析及风险分析,并在其量化的基础上,开发制定各种相应应急及恢复计划、方法和流程,以减轻灾难对于企业的不利影响。 BCM的实施包括一系列企业管理行为,核心是制定并实施业务连续性计划其具体操作如下: 1. 启动项目; 2. 风险评估和业务影响分析; 3. 制定BCM策略; 4. 编制具体计划; 5. 测试和完善计划; 6. 更新维护计划。
以上介绍了企业实施BCM的必要性及实施办法,重点介绍了企业实施BCM需要着重考虑4P要素。除此以外,企业在实施BCM过程中,要考虑的关键技术和领域还很多,例如技术方案的成本决策、法规遵从、最佳实践的参考等等。由于篇幅关系,本文不再赘述。 链接 BCM是一个整体的管理策略,包含一系列管理流程。BCM目标在于确定可能发生的冲击和威胁,并提供一个企业管理架构来阻止和抵消这些威胁,或者尽可能减低灾难带来的不良后果。 银行建设BCM现状及经验 目前,BCM建设在我国保险、金融等领域已经得到了较广泛的应用,发展较快。作为中国人民银行科技司副司长同时身兼中国信息化推进联盟BCM专业委员会副主任委员李晓枫,曾就银行开展BCM的意义及实践经验做过演讲。 银行需要BCM 他认为,发达国家比较看中的是BCM,发展中国家关注的是灾难备份(DR)。从这个关系来看,在银行完成业务信息化后,有个突出的需求:过去自己业务停留在本系统,现在希望业务实现跨行业的业务信息化,比如财政、国税、国库、银行等的横向联合,实现多个部门的业务联合。 国家宏观经济管理、国家金融监管等也是涉及到跨业务、跨部门、横向跨网络的互联互通,怎么保证这些业务的持续性?首先是灾难备份。这是属于信息安全领域的工作。2003年,中共中央办公厅、国务院办公厅以中办发[2003]27号文件转发了《关于加强国家信息安全保障工作的意见》,文件对中央各个直属机关、各级政府以及各行各业的信息安全保障工作做出了原则性的规定,明确提出要重点保障重要信息系统的安全。之后,相继出台了一系列相应的政策法规,其中,公安部出台的信息安全等级保护标准,对业务部门搞好安全工作提出了原则性的指导。 银行信息系统的安全直接影响到国民经济的正常运行,也直接关系到社会的稳定和人民群众的生活。银行的信息安全现状是:在重视程度、实施措施、监管力度上还有一定欠缺。人民银行会把BCM提到议事日程,并指导商业银行开展相应的工作。 当前,银行业务已经高度依赖信息化。一个完善有效的BCM,有助于IT灾难备份明确需求,是IT灾难备份系统构建的依据。我们可以通过BCP验证方案的有效性,更好地配合业务发展。 人民银行相关规定 信息安全是一个很大的范畴,就业务持续发展来说 ,首先要做的是灾难备份。原则上对大的商业银行建议其可以自建灾难备份系统;而中小商业银行,尤其是城市商业银行建议可以采用外包的方式建立灾难备份系统。其次,人民银行要做好应急的预案和协调应急预案工作,应急的预案是银行自己要做的,协调应急预案则涉及到电力、通信等其他部门。 针对银行业数据集中存放、业务集中处理的信息化发展特点,人民银行2002年8月下发了《关于加强银行数据集中安全工作的指导意见》,明确指出,为保证银行业务持续性,确保银行业务稳健运行,实施数据集中的银行必须建立灾难备份中心,要制定业务持续性计划,并且要报备人民银行。 挑战与希望 尽管我国在灾难备份上进行了一些有益的尝试和实践,但是法律法规仍相对欠缺,目前全国各行业存在盲目发展建设的倾向,急需国家就安全建设的目标、灾难备份中心和灾难备份系统的建设给予明确规定和指导。 现在,还有很多行业的主管部门没有制定相应的监管政策和法规。人民银行已经出台了相应的指导文件和法规,并将银行灾备建设列为我国金融业计算机安全检查的重要内容。 灾难恢复和业务持续管理全国要协调发展,需要加强宣传和教育,促使各部门认识到灾难备份和业务持续管理是信息安全保障的最根本机制,也是应急机制的最重要的一个环节。新成立的BCM专业委员会对我国各行业的信息系统、灾难恢复计划、应急协调计划以及各级政府机构和企业业务持续计划和全社会的信息安全保障发挥积极的作用。
来源: 中国计算机用户 如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐 jill.jiang@amt.com.cn | 021-51096826-112 | 在线联系 |
|
|
|