|
数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 (1)面向主题。传统的操作型系统是围绕公司的功能性应用进行组织的。对一个保险公司来说,应用问题可能是汽车保险、健康保险、人寿保险与意外伤亡保险。公司的主要主题域可能是顾客、保险单、保险费与索赔。而对一个生产商来说,主要主题域可能是产品、订单、销售商、材料单与货物。对于一个零售商来说,主要主题域可能是产品、库存单位、销售、销售商等。不同类型的公司,其主题域是不同的。 (2)集成。在数据仓库的所有特性中,集成是最重要的。数据仓库中的数据是从多个不同的数据源传送过来的。这些数据进入数据仓库时,需要进行加工与集成、统一与综合之后才能进入数据仓库。数据仓库中的数据是对原有分散的数据库数据经过加工、汇总和整理后得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 (3)相对稳定。数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询,一般不发生更新操作。 (4)反映历史变化。数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 【出处】William H. Inmon 著,王志海 等译.数据仓库,机械工业出版社,2018.
|