|
访问数据仓库所需的时间永远不能用毫秒来计算。由于数据仓库中数据的特性,数据的数量以及使用数据时的工作量,数据仓库不适合用于OLTP过程。访问数据仓库在1秒以下的响应时间从体系结构上来讲并不可行。 但实际上,低于1秒的响应时间在很多操作中很有意义。很多商务事务需要非常快的响应时间,当然这些事务不能访问数据仓库。如果必须要求低于1秒的响应时间,或者是要访问集成的数据,可以通过一种叫操作数据存储(Operational Data Store,ODS)的结构来实现,这种结构能提供高性能的处理。 ODS不像是数据仓库,是可选的。有一些组织有ODS,而另一些组织没有。是否需要ODS完全取决于组织自身以及所处理的工作。 ODS和数据仓库在很多方面是互补的。它们都处于操作环境以外,都支持决策支持系统处理,都使用集成数据。因此,人们经常认为ODS和数据仓库是互补的。数据在ODS和数据仓库之间双向地交流。在一些情况下,ODS支持数据仓库。在另一些情况下,数据仓库支持ODS。但是,ODS毕竟与数据仓库在物理结构上不同,ODS无论如何也不能处于数据仓库当中。 与数据仓库环境不同,ODS设计为高性能、实时处理。ODS在设计上能够满足响应时间为2到3秒的事务。它有几个特性用来支持这样快速的响应时间,包括: 1.将工作负载分成不同的处理模式。当事务需求的数据很少时,ODS支持高性能的处理。当事务需要大量的数据时,ODS的处理时间会比较长。 2.ODS中的一些数据是为高性能的事务处理过程设计的,其他的数据是为灵活及集成访问设计的。 3.处理升级过程时,要使用小的事务,每个事务消耗少量的资源。 数据仓库的一个非常明显的特性就是不进行升级。数据仓库由许多有限的数据快照组成。一个快照存储好以后,数据仓库中的数据就不变化了。如果现实世界中的数据发生变化,就对数据进行一个新的快照,然后放入数据仓库当中。 ODS环境中的数据不是这样的。在ODS中,数据的更新非常常见,而且数据的更新是可行的。假设ODS当中有一个数据记录,其值是597。如果发生变化,它可以变为630,这个值不用任何快照就可以在ODS中改变。 数据仓库和ODS之间数据特征的不同可以用另一种方式来解释:ODS中的数据是“实时值”,但是数据仓库当中的数据却是“历史值”。也就是说,如果访问ODS,能找到关于你所找话题的最新信息。如果你访问数据仓库,你找到的就是历史信息记录。 【出处】William H. Inmon著,王志海 等译.数据仓库,机械工业出版社,2018年10月第1版.
|