各家数据仓库产品的评估

 

建立数据仓库

OLAP服务器

IBM


优点:

◎ 提供大型数据库DB2作为数据仓库的存储数
 据库,DB2性能优异,提供从桌面机到工作  站、小型机、大型机的良好扩展性。
◎ 提供Visual Warehousing作为数据抽取工具
 VW能够从广泛的数据源抽取数据,并且在大
 数据量的抽取中充分显示了速度优势。VW提
 供编程接口,提供调用外部程序的功能,能
 够按计划自动执行数据抽取,提供对Cube处
 理的功能。
◎ VW提供Agent把数据抽取分布到工作站、小
 型机、大型机等各种平台。

缺点:
◎ VW6.1在实现数据抽取时,界面不够友好,
 在处理复杂的数据源时,与其它厂商提供的
 抽取工具相比,将面临更多的工作量。但在
 VW的最新版本7.1中已得到良好的改善。


优点:

◎ 提供多维型、关系型两种Cube的实现方式。
◎ 能够在超大型数据仓库上提供同类产品中最佳的性
 能。
◎ 提供专门的币种维,用于处理各行业的多币种业务
 实现跨国公司的业务分析。
◎ 提供专门的财务维,用于处理财务对维和测量值的
 特殊运算。
◎ 能够在测量值上实现层次结构。
◎ 能够实现维和测量值的不规则树。
◎ 能够实现复杂的计算值,为计算值提供丰富的函数
◎ 提供透明访问。
◎ 在所有同类产品中提供最强大的分区功能。
◎ 提供功能强大的访问Cube的查询语法 Query
 Script。
◎ 支持高性能的Unix工作站、小型机、大型机。

缺点:
◎ 提供的编程接口不如Microsoft的易于使用。

Oracle


优点:

◎ 提供RDBMS和MDDB两种数据存储结构,
 Oracle功能强大,提供了良好扩展性, 提供
 了功能强大的系统管理界面。
◎ 提供Oracle Warehouse Builder作为数据抽
 取工具,OWB提供功能包括:模型构造和设
 计;数据提取、移动和装载;元数据管理;
 分析工具的整合;以及数据仓库管理。具有
 开放可延伸的框架。

缺点:
◎ OWB不能把数据抽取扩充到Unix工作站、小
 型机、大型机。
◎ OWB提供的流程很繁琐,不易于使用。


优点:
◎ 提供多维型、关系型、混合型3种Cube存储方式。
◎ 支持超大型数据仓库,并提供多种优化手段和针对
 数据仓库的特征,如分区,位图索引。
◎ 提供功能强大的访问Cube的查询语法Express
 command 。
◎ 预制的OLAP应用(Oracle Financial Analyzer,
 Oracle Financial Controller和Oracle Sales
 Analyzer),减少了实施时间和费用。
◎ 为计算值提供丰富的函数,可自由扩展。◎ Web代
 理及Web出版。
◎ 可以支持高性能的NT服务器,支持Unix工作站、小
 型机、大型机。

缺点:
◎ 在解决多币种问题上没有提供解决方案。
◎ 不能在测量值上实现树状的多层结构。
◎ 不能实现虚拟Cube。
◎ 不提供透明访问。
◎ 对于较复杂、灵活的计算公式不能实现。
◎ 对系统配置要求较高。
◎ 没有提供的VB编程接口。

Microsoft


优点:

◎ 提供数据库Microsoft SQL Server7.0作为数
 据仓库的存储数据库,SQL7提供了各种数据
 库产品中最友好、易用的系统管理界面。
◎ 提供DTS作为数据抽取工具,DTS不仅能够从
 广泛的数据源抽取数据,而且提供市场上最
 有效的编程方式,以及工作流的任务处理方
 式;不仅提供调用外部程序的功能,而且提
 供强大、丰富的被外部程序调用的对象库;
 能够按计划自动执行数据抽取。DTS是最系统
 最易用、扩展性最好、编程效率最高的数据
 抽取工具。

缺点:
◎ SQL7可以扩充到高性能的NT服务器,不能扩
 充到Unix工作站、小型机、大型机。


优点:
◎ 提供多维型、关系型、混合型3种Cube存储方式。
◎ 提供同类产品中最好的对象体系结构,并为访问
 OLAP提供了不同目的和层次的对象库。
◎ 在同类产品中提供用于计算值的函数最多,并且用
 户还可以扩展函数,这有助于建立任何复杂的计算
 指标。
◎ 在同类产品中独家提供用户可定制聚合函数的功能
◎ 在同类产品中独家提供一套系统的、专门的访问
 Cube的查询语法MDX。
◎ 提供多种处理复杂关系的维的方法,用于描述现实
 世界维的层次之间的复杂关系。
◎ 能够实现维的不规则树。
◎ 提供透明访问。
◎ 提供虚拟Cube。

缺点:
◎ 在解决多币种问题上没有提供解决方案。
◎ 可以支持高性能的NT服务器,不支持Unix工作站、
 小型机、大型机。

Informix


优点:
◎ 提供大型数据库Informix作为数据仓库的存
 储数据库,Informix提供从桌面机到工作站
 小型机的扩展。并提供专为数据仓库设计的
 数据库RedBrick。
◎ 提供Ardent DataStage作为数据抽取的工具
 提供工作流的方式,可以实现内部编程。

缺点:
◎ Ardent DataStage对实现数据抽取功能所提
 供的处理方式过于简单,这将使用户面临过
 大的工作量,在保证程序的高效性和准确性
 方面提供的措施太少。


优点:
◎ 能够在超大型数据仓库上提供同类产品中较好的性
 能。
◎ 独家提供快速、灵活地实现临时构造维层次关系的
 功能。

缺点:
◎ 在解决多币种问题上没有提供解决方案。
◎ 不能实现虚拟Cube。
◎ 提供用于构造计算值的函数太少,不能构造复杂、
 灵活的计算值,如不能实现同期比较。
◎ 不提供透明访问。
◎ 不能实现维、测量值的不规则树的层次关系。
◎ 难于安装和维护。

CA Platinum


优点:
◎ 提供第三方的数据库如:Microsoft SQL
 Server、Informix、Oracle、Sybase、DB2等
 作为数据仓库的存储数据库。
◎ 提供Inforbump作为数据抽取工具,抽取速度
 较快。

缺点:
◎ 提供的数据抽取工具Inforbump是非工作流的
 工作方式,这将使用户面临过大的工作量,
 在保证程序的高效性和准确性方面提供的措
 施太少。虽然性能较好,但价格昂贵,是同
 类产品中性价比较低的产品。


优点:
◎ 提供功能强大、复杂的计算能力,可用函数较多。
◎ 提供透明访问。

缺点:
◎ 响应速度太慢,响应时间是较好产品的3~5倍。
◎ 在聚合策略上是各厂家中最差的。若选取临时聚合
 的方式,响应速度会极慢,而采用事先聚合方式,
 用户又必须编写极大量的程序。
◎ 难于安装和维护。
◎ 提供的编程接口不仅功能很弱,而且难于使用,不
 是面向对象的对象库,仅是平面结构的接口函数。
◎ 在解决多币种问题上没有提供解决方案。
◎ 不能实现虚拟Cube。
◎ 不能实现维、测量值的不规则树的层次关系。