|
下一代ETL拥有数据集成的优势
无论是批量处理还是实时处理,下一代 ETL 对于数据集成都是正确的选择。两个系统之间数据的同步要比简单的将数据从 A 处移到
B
处要复杂的多,有协调、交叉匹配、去冗余和清除无用数据等操作。这些大量数据操作的效果主要依靠于关系型数据库的效率和测量性,以及数据缓存空间的容量和速度等。例如,企业的数据仓库项目往往需要将大量的数据在短时间内移入到制定位置,这其中效率就扮演了重要的角色。如果越多的数据需要移动,越复杂的任务需要操作,那么也就越证明了
ETL 将是正确的选择。
ETL 工具是诞生于这个关系型数据库的时代,所以面向 SQL
的数据转换工作也是它所擅长的。这些工具可以从多个相关的表种提取数据,并且分析理解这些表格之间的关系,并可以通过结合、合并或者连接等操作将其他数据源中的数据添加进来。这操作可能包括简单的连接两个表格,也可能是包含了复杂的多系统中多种表格的连接。下一代的
ETL 工具能够自动产生 SQL 代码,并且进行一定程度的优化,可以免去大量的手工编制代码的工作。
EAI在流程集成方面的优势
EAI 工具是适用于流程集成的,适用于在各个阶段上传输和跟踪文档。 EAI
能够处理企业级的业务工作流以及将在这些流程中相关的应用系统进行集成。 EAI
中间件则扮演了工作流引擎的角色,可以几乎达到实时的系统集成,能够将少量的数据通过消息队列传输。 EAI
工具能提供更完备的工作流功能,提供更成熟的开发环境,使得设计者、开发者和管理者能直观的管理更加复杂的商业流程。
像 ETL 工具一样, EAI 工具也能够进行数据转换,事实上,主流的 EAI 工具已经拥有了数据转换包。然而 EAI 工具所转换的数据对象与 ETL
工具所操作的对象是不一样的。 EAI 工具是为了操作个别的事务而产生的,因此典型的 EAI
转换的数据一般都是有规则的,或者是用于处理结构单一且确定的数据,往往是单行的数据,而不能用来处理那些集合形式的数据。

EAI 工具在传输大量消息或者事务方面能够有比 ETL
工具更好的效果,特别是将数据进行一对多传输的时候。近十年 EAI 已经致力发展高效可升级的一对多、多对多实时事务消息发布和传输功能。 EAI
工具已经具有每小时百万级的事务处理能力。能够在多个服务器上将工作流分解,使多个环节同步处理。即使出现一台或少数几台服务器当机的情况,也能够通过分布式处理来保证工作流的正常运行。
结论
ETL 工具适合数据集成, EAI 工具则适用于流程操作。
下一代 ETL
工具更加适用于解决两个系统间数据的批量或者实时同步工作,特别是当大量巨大的数据在两个系统间提取、转换和存储时, ETL 的优势更加明显。 EAI
则适用于工作流和商业流程管理的需求,特别是擅长处理大量小事务。
对于交互式流程,如果它没有扩展工作流的需求,没有复杂数据的转换的需求,或者需要批量实时数据的合并处理,则 ETL 工具将是比较好的选择。


而现在许多企业 EAI 和 ETL 两种技术都采用,因为哪个技术都不能满足企业所有的需求。
|