|
构建非独立数据集市的优势:省时省钱(by AMT 胡鹏 编译)本文关键字 理论探讨 广告 引言:我常常碰到客户问我最多的一个问题是:独立的数据集市还是非独立的数据集市,那一种系统策略是最优的。尽管两种方案都有个自的优势,但我经常会推荐非独立的数据集市(DDM)方案。 构建非独立数据集市的优势:省时省钱 by AMT 胡鹏 编译
当我建议采用DDM方案时,人们向我回敬过来的第一个问题是构建一个全公司范围的数据库将所费不赀,而仅是为了建立数据集市回答一些专门的商务问题似乎代价太大。确实是这样,毫无疑问会存在这个问题。然而,这笔钱早晚是要支出的。DDMs和独立数据集市(IDM)可以帮助用户从数据库中快速获取解决商务专业问题的答案。然而,建立IDMs的一个最重要的难题是因为他们是非独立的,他们会变成仅仅是另一个遗留系统被整合到整个的公司信息网络中。当整合系统的时机来临时或已经来临时,却发现需要整合分布在七个不同的服务器平台上的十五个数据集市时,并且这七个平台还与三到四个不同的局域网连接时,那真是一个让人头痛的任务。下图1显示了你在程序整合时期会面对的问题:
图1:独立数据集市(DDM)整合疑难问题表 当你最初建立一个涉及整个企业数据库(EDW),你可以减低整合问题中的难度。首先,我们要明白建立全企业范围的数据库并不意味着你必须要执行一个耗时两年,会花费两百万的庞大计划。你可以就某个专门的商务疑难的解决方案来建立你的数据仓库。该方案以三到四个应用程序为主干作为策划用于服务解决诸如不能恰当预测销售额的问题。随着时间的推移,你可以面向数据库添加越来越多的应用程序。那么,随着数据库中信息数量的增长,你就可以相应的在其中挑选并创建数据集市以提供个别的商务功能。 你自身也发现你不得不建立DDMS,因为在EDW中到处充斥的信息将会降低获取所需数据的速度。当你构建你自己的DDMs后,你就可以快速获取你所需的数据,而且还是标准化的、精确的数据。你的整合问题难度将会降为整合遗留的应用程序的问题:即EDW与EDW系统的兼容问题。下图2 显示了简化了的EDW/DDM系统。 图2:非独立的数据集市系统 与IDM方案相比,DDM方案同时还向你提供另一个重要的优势:仅需要简便的维护就可以保持长期的高效能。DDM/EDW系统向所有数据提供一个中央存储工具。当数据从遗留系统装入EDW或IDM时,它会清除并转换成单一的形式。在多个IDMs情况下,数据可能会是不同的格式,而经过转换后,我就可以在松散统一格式条件下使用数据了。而在多个DDMs条件下,数据会与它在EDW中的格式相同(完全一致)。所以我确信,在一致性和低成本维护方面有一定的关系。这个关系就是找到数据错误的成本。 当在一个IDM系统中发现数据不准确时,找出问题可能就像在大海里捞针那样难。随着提取、转换和装载(ETL)工具和每个IDM数据库,每个遗留的系统都要查证。另外,直到你开始试图听从部门报告时,数据错误甚至可能还是找不到。大量的时间花费在发现文集和研究问题本身,而且对每个IDM的方案的宣传也要两费很多时间。 然而,使用一个DDM/EDW系统,对于数据准确性问题的研究常常在ETL阶段中开始,同样在其中结束。ETL工具本身将可能不是问题,但是你能打赌ETL工具会有不准确的转换法则和映射规律。一旦你找到错误的源头,该装置会自动传向每个DDM,因为它是依赖于EDW来采集数据的。如果在EDW中的数据是正确的,在DDMs总的数据同样也会是正确的。经过长期的努力。这种简便的维护会节省你成千上万的人工时间和资本。 第二,也许是最重要的是,一个DDW/EDW系统的优势是以整个企业的角度来看你的数据和组织性能。请记住你首先要建立数据集市的原因。直到与数据分析相关,你在观察整个事物中才会有问题。例如,你不能区分如果去年的收入下降的真正原因是由于全面销售不力,还是仅仅是因为在一些专门地区某种关键产品需求的下降。因此,你希望一个方案能使你从所有地区和时间段挖掘出销售数据。你可以应这个目的建立一个IDM,它可以向你提取纯粹的销售数据来回答你的问题。然而,有比销售数量更多的有关销售的信息。而一个IDM不可能告诉你这些。使用一个IDM,你将会被很少的销售数据多孤立。你将对其他部分一无所知。更糟糕的是你不知道你不知道。 使用DDMs网络可以从整个企业数据仓库中获取数据,你能从整个企业来看你的性能。你将再也不会被隔离在信息的孤岛上。你也许会发现,销售数量的下降并不是引起收入表现差的原因,而是你花了太多的钱在出差上。你能找到这个原因是因为如果你需要的话,你是从整个企业的角度来看问题,而不是从仅从销售这个角度来找问题。从整个企业角度找出引起问题根本原因的能力对任何企业都几乎是一种无价的方式。确实,你也许看不到从根本原因分析中的任何实在的好处,但是你会看到你节省了时间,加强了问题分析和解决问题的能力等很多无形的好处。 我不能替你做决定。但是,我想再次说,强烈的建议你考虑非独立的数据集市,而不是独立的数据集市作为你信息分析问题中的解决方案。在很多从始至终的数据仓库策划中,客户最满意的是他们采用建议先建立了公司的数据仓库,然后在其上建立了DDMs。这将在应用程序整和是大大节省你的时间和资金,它还会节省你在解决问题时的维护时间,是你从一个更广的角度看待你的公司。 作者联系方式:peng.hu@amteam.org 如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐 jill.jiang@amt.com.cn | 021-51096826-112 | 在线联系 |
TTNN-BI观点十月刊——湖光山色2007,国际权威重新定义了BI。从当前实践看来,这种定义符合实际,毕竟BI要落地,要能给企业带来真正的收益。当然,如何落地,自然必须有技术的支撑和管理策略及相…… 专业博客 |
|
|