在线分析处理(OLAP)简介(by AMT 胡鹏)

2002-12-17 15:33:53【作者】 畅享网 【进入论坛】
本文关键字 理论探讨
广告

摘要:本文将阐述OLAP的定义,谁使用它以及为什么要使用,并说明由OLAP协会提出的基准规范所要求的OLAP软件的主要功能特点。

在线分析处理(OLAP)简介

by AMT 胡鹏

导言

本文将阐述OLAP(On-Line Analytical Processing,在线分析处理)的定义,谁使用它以及为什么要使用,并说明由OLAP协会提出的基准规范所要求的OLAP软件的主要功能特点。

什么是OLAP?

在过去的十年中,大部分公司的数据都已经移入到关系数据库中,关系数据库已在操作和控制领域得以广泛应用,特别是在事务处理方面(例如,制造流程控制、经纪交易等)。为了在此领域取得成功,关系数据库开发商已投下了重金,使众多小事务得以高效执行,并具备一定的数据容错能力。

近些年来,关系数据库开发商也开始把他们的数据库作为构建数据仓库的工具进行销售,数据仓库存贮战术性的信息,用以回答关于过去发生事件的“谁”、“什么”等问题。对数据仓库提交的典型查询比如:“东部区域第三季度的总收益是多少?”。

值得注意的是,应当把数据仓库的能力与OLAP系统的能力区别开来,数据仓库通常是基于关系技术的,相比之下,OLAP用合计数据的多维视图提供对战略信息的快速获取,以进行深层次的分析。

OLAP可让分析家、经理、执行官等,通过快速、一致、互动的访问方式,得到有关信息的各种可能视图,进而获得对数据的透视能力。OLAP可对原数据进行转换,以便将企业的真实情况按用户理解的方式反映出来。

尽管OLAP系统也可以回答“谁”、“什么”这类的问题,但是其回答“如果-怎样”和“为什么”这类问题的能力才是与数据仓库的真正区别。OLAP可以对未来行动提供决策,典型的OLAP计算比简单的数据加总要复杂得多,例如:“如果果汁价格上升$0.1/加仑,运输成本下降$0.05/英里,那么这将给软饮料分销商带来什么影响?”

OLAP与数据仓库是互为补充的的,数据仓库存贮并管理数据,OLAP将数据仓库的数据转变为战略信息。OLAP的范围包括从基本的导航和浏览(即通常所说的“切片和切块”),到计算,到更深层次的分析(比如时间序列和复杂建模等)。当决策者学会了更高级的OLAP技能后,他们就从数据访问走向了信息进而走向知识。

谁使用OLAP?为什么使用?

OLAP应用程序跨越各种组织功能。财务部门对OLAP的应用比如预算、基于活动的成本计算(分配)、财务性能分析和财务建模等,销售分析和预测是销售部门对OLAP两种应用。其他应用中,市场营销部门用OLAP进行市场研究分析、销售预测、促销分析、客户分析以及市场/客户分割等。典型的制造业OLAP应用包括产品计划和故障分析等。

在所有上述应用中,重点在于当经理作出事关企业战略方向的有效决策时,为其提供所需信息的能力。判断一个OLAP应用是否成功的主要指标,就是提供所需信息的能力,具体的说,就是为有效决策提供即时(just-in-time)信息的能力,这要求不只是能得到基础层次的详细数据。

即时信息是经过计算的数据,通常反映了复杂的关系,并且经常是立刻计算出来的。只有当反映时间较短时,对复杂关系进行的分析和建模才具有实用性。另外,由于数据间所存在的关系事先也许并不知道,因此数据模型必须具有灵活性。在作出有效决策时,经常需要改变业务需求,一个真正灵活的数据模型可确保OLAP系统对这种变化快速作出反应。

尽管OLAP应用于各种不同的领域,但概括起来都应具备下述主要特点:

数据的多维视图

强大的计算能力

时间智能

多维视图

多维视图本质上是用来表现真实业务模型的,很少有限制在三维以下的业务模型,经理们通常通过情景(例如实际与预算比较)、组织、行目和时间等来查看财务数据;对于销售数据则通过产品、地理、渠道和时间来进行。

数据的多维视图提供的不仅仅是“切片和切块”的能力,它提供了通过对信息灵活访问来进行分析处理的基础。数据库的设计不应该先就预定在某一维上可执行哪些操作,或是这些操作的执行有多快。经理们必须能在任何一个合计层次上、以同等的功能和简便性、跨越任何一维进行数据分析。OLAP软件应当能以自然的、快速反应的方式支持这些数据视图,而不要让信息用户去接触那些复杂的查询语法,毕竟,对经理们来说,并没有必要去理解复杂的数据表设计,费劲地进行表连接及精简数据表等。

不论一个查询请求是要得到跨越所有地区的周产品销售额,还是想得到某个城市中跨越所有产品的截止到当前的销售额,OLAP系统都必须具有一致的反应时间,不应因为经理们所作查询的复杂性而导致低效,不管是在生成查询所需精力方面还是在接收答案所花的时间方面。

OLAP协会的APB-1性能基准可用于测试服务器提供多维数据视图的能力,其具体做法是在测试过程中不断改变复杂性和范围并反复提出查询。基本合计是在某些维(产品、客户及渠道等)上执行的,更复杂的计算则在其它维上进行,对测量维计算其比率和均值,在情景维方面则计算其差异,基于历史性能的复杂模型则用于计算预测情景。对这些查询一致的快速反应时间是衡量服务器提供多维信息视图能力的主要指标。

复杂计算

对于OLAP数据库的真正考验是其执行复杂计算的能力,OLAP数据库的能力虽然决不只限于执行简单合计。虽然各层次上的合计功能是相当重要的,但在分析时除了将数据简单聚集起来之外,另外还有很多需要做的事。更复杂的计算包括份额计算(合计百分比)和分布(从自顶向下的视角利用层级)。

关键性能指标经常还会涉及到代数等式。销售预测中采用了趋势算法,比如移动平均数和百分比增长等;如果要对给定的公司及其竞争者进行销售和促销分析,则须建立各方之间复杂的关系模型。现实世界是极复杂的,建立复杂关系模型的能力是分析型处理应用的关键所在。
OLAP软件必须能提供具有丰富的工具包,其功能要强大而所用的算法则要简洁。为了使开发者效率更高,业务用户更便于使用,执行算法的工具应当是清晰且非程序化的。如果用于完成所需计算的方法不够清晰,则开发时间就将更长,使用起来就会更困难;如果计算方法是程序化的,对系统的改变不能及时完成,这将成为获取即时信息的障碍。

评判事务处理系统的优劣是根据其收集和管理数据的能力,与之相对,分析型处理系统的优劣标准则是根据其从数据中创造信息的能力。OLAP协会的APB-1性能基准选择了一些具有代表性的计算操作,既有简单的也有复杂的,其中,对利润(销售减成本)的计算是简单计算的例子,对预测的计算则是当前版本的性能基准中最复杂的计算,历史数据用于计划未来而合计数据则用于估计输入数据。其它更为复杂的计算,比如分布和趋势分析等,也经常可在各种OLAP系统中找到。

时间智能

时间几乎是任何一种分析型应用中必不可少的一个组成部分。时间是一个独特的维,因为其具有顺序特性(1月总是比2月先来临),真正的OLAP系统充分考虑了时间的顺序性,业务性能总是在某一时间基础上来进行衡量的,例如,这个月与上月相比,这个月与去年同期相比等。

时间分级的应用与其它种类的分级并非总是相同的,例如,一个经理可能会要求查看1995年5月的销售额或是1995年前5个月的销售额,同样是这个经理,他也许也会要求查看蓝色衬衣的销售额,但却决不会要求查看前5件蓝色衬衣的销售额。在OLAP系统中必须能对诸如“截止到目前”和“期与期之间的比较”等概念方便的进行定义。

此外,OLAP系统必须考虑基于时间的结算额概念。例如,如果一个公司在1月份售出10件衬衣,2月售出5件,3月售出10件,那么该季度的总销量就是25件;另一方面,如果一个公司在1月有10个员工,2月只有5个,3月又有10个,那么该季度公司的人头数是多少?多数公司都会使用平均人数。而在现金的处理方式上,多数公司将使用期末余额。

OLAP协会的APB-1性能基准中包含了如何在OLAP应用中处理时间问题的例子,平均销售额采用三个月的移动平均数,库存额的合计则采用期末余额,预测计算运用今年与去年相比的知识、截止到目前的知识以及按年计算的因素等。

OLAP的优点

成功的OLAP应用可提高业务经理、开发者以及整个组织的生产率,OLAP系统固有的灵活性意味着OLAP应用的用户可以更加独立自主,经理们不必再依赖IT以完成修改模式、创立连接或其它更复杂的工作,更重要的也许是,OLAP使经理们能够对问题进行建模,这一点在缺乏灵活性且需要冗长而不一致的反应时间的系统中是无法做到。更好的控制以及对战略信息的及时获取等于更有效的决策。

使用合适的OLAP软件,IT开发者也能从中受益。虽然利用事务处理或数据收集等软件来建立OLAP系统也是可能的,但这对于开发者来说,其时间的利用效率显然不高。通过使用专门为OLAP设计的软件,开发者可以更快地将应用程序交给业务用户,提供更好的服务,应用程序的快速交付同时也减少了应用程序的积压。

OLAP使决策用户能够独立自主地建立自己的模型,这也进一步减少了应用程序的积压。然而,与其它运行在PC网络上的独立的部门应用程序不同,OLAP应用程序依赖于数据仓库和事务处理系统以更新其数据源,其结果就是,产生了更多的独立自主用户而又没有放弃对数据的完整性控制。

有了OLAP,IT效率也将得到提高。通过使用OLAP软件,可以减少查询障碍和事务处理系统及数据仓库中的网络通信量。

最后,通过提供对现实业务问题的建模能力,以及对人力资源的更有效利用,OLAP使整个组织能更快地对市场需求作出反应,进而增加收益,改善盈利状况。

作者联系方式:hupe2000@sina.com

如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐
jill.jiang@amt.com.cn | 021-51096826-112 | 在线联系
罗永辉呼吸BI[原创]商业智能:感性到理性 完..

  2007年是商业智能从感性回归理性的一年,也是从完善到提升承前启后的一年。 回顾篇 认识层面 2007年,国内国外普遍加深了对BI的理解。Gart……

TTNN-BI观点TTNN-BI观点十月刊——湖光山色

2007,国际权威重新定义了BI。从当前实践看来,这种定义符合实际,毕竟BI要落地,要能给企业带来真正的收益。当然,如何落地,自然必须有技术的支撑和管理策略及相……