|
元数据是数据仓库环境的一个重要组成部分。元数据就是关于数据的数据。自从有了程序和数据,元数据就是信息处理环境的一部分。但是,在数据仓库中,元数据扮演一个新的重要角色。正因为了有了元数据,数据仓库才被最有效地利用。元数据使最终用户或DSS分析员能够探索各种可能性。换一种说法,如果一个数据仓库中没有元数据,那么用户就不知道如何着手进行分析。用户必须首先对数据仓库进行各种试探,才能确认其中有哪些数据和没有哪些数据,这样就浪费了大量时间。并且,即使用户对数据仓库进行了一些试探,仍然不能保证能找到正确的数据,也不能保证对所见到的数据正确地做出解释。如果有元数据的话,最终用户就可以很快找到所需数据或确认这些数据没在数据仓库中。 元数据与指向数据仓库内容的索引相似,处于数据仓库的上层,并且记录数据仓库中对象的位置。一般,元数据存储对以下各项进行了记录: 1.程序员所知的数据结构; 2.DSS分析员所知的数据结构; 3.数据仓库的源数据; 4.数据进入数据仓库时进行的转换; 5.数据模型; 6.数据模型和数据仓库的关系; 7.抽取数据的历史记录。 【出处】William H. Inmon著,王志海 等译.数据仓库,机械工业出版社,2018年10月第1版.
|