|
数据血缘关系是指数据从产生、处理、流转到消亡过程中,数据之间形成的一种类似于人类社会血缘关系的关系。和人类社会血缘关系不同的是,同一个数据可以有多个来源。一个数据可以是多个数据经过加工而生成的,而且这种加工过程可以有多个。 1.表级血缘关系。针对表结构的情况,最终用户和运维用户最需要关注目标表中每个字段的数据的来源有哪些。即建立源表、源字段与目标表、目标字段的映射关系。一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来自户籍人口表,也可能来自流动人口表,也就意味着这两张表合并起来的人口,才是这个区域的所有人口。 2.字段级血缘关系。从当前记录出发,可以按时间查看该记录所有的变更过程。一条记录的生成可能对应两个表的两条记录,这种对应是可跟踪的。 【出处】祝守宇,蔡春久 等著.数据治理——工业企业数字化转型之道.电子工业出版社,2020年11月第1版.
|