|
数据质量维度是数据的某个可测量的特性。术语“维度”可以类比于测量物理对象的维度(如 长度、宽度、高度等)。数据质量维度提供了定义数据质量要求的一组词汇,通过这些维度定义可以评估初始数据质量和持续改进的成效。为了衡量数据质量,组织需要针对重要业务流程(值得测量的)和可以测量的参数建立特征。维度是衡量规则的基础,其本身应该与关键流程中的潜在风险直接相关。 2013年,DAMA UK发布了一份白皮书,描述了数据质量的6个核心维度: 1.完备性。存储数据量与潜在数据量的百分比。 2.唯一性。在满足对象识别的基础上不应多次记录实体实例(事物)。 3.及时性。数据从要求的时间点起代表现实的程度。 4.有效性。如数据符合其定义的语法(格式、类型、范围),则数据有效。 5.准确性。数据正确描述所描述的“真实世界”对象或事件的程度。 6.一致性。比较事物多种表述与定义的差异。 【出处】Batini, Carlo, and Monica Scannapieco. Data Quality: Concepts, Methodologies and Techniques. Springer, 2006. Print.
|