找回密码
 立即注册
查看: 40|回复: 0

数据词典:数据血缘关系(Data Lineage)

[复制链接]

1231

主题

74

回帖

4110

积分

管理员

积分
4110
发表于 2025-11-25 10:25:17 | 显示全部楼层 |阅读模式
数据血缘关系是指数据从产生、处理、流转到消亡过程中,数据之间形成的一种类似于人类社会血缘关系的关系。和人类社会血缘关系不同的是,同一个数据可以有多个来源。一个数据可以是多个数据经过加工而生成的,而且这种加工过程可以有多个。
1.表级血缘关系。针对表结构的情况,最终用户和运维用户最需要关注目标表中每个字段的数据的来源有哪些。即建立源表、源字段与目标表、目标字段的映射关系。一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来自户籍人口表,也可能来自流动人口表,也就意味着这两张表合并起来的人口,才是这个区域的所有人口。
2.字段级血缘关系。从当前记录出发,可以按时间查看该记录所有的变更过程。一条记录的生成可能对应两个表的两条记录,这种对应是可跟踪的。
【出处】祝守宇,蔡春久 等著.数据治理——工业企业数字化转型之道.电子工业出版社,202011月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2026-1-3 04:21 , Processed in 0.075520 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心 备案图标.png 京公网安备11011102002767号 京ICP备2024094898号

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能职业认证中心

快速回复 返回顶部 返回列表