找回密码
 立即注册
查看: 41|回复: 0

数据词典:分布分析(Distribution Analysis)

[复制链接]

1231

主题

74

回帖

4110

积分

管理员

积分
4110
发表于 2025-12-5 11:14:04 | 显示全部楼层 |阅读模式
分布分析(distribution analysis)是一种通过评估数据集的一个字段中的任何个别值的相对比例和个别值的相互关系,来确定一组值的合理性的数据分析形式。作为输入,分布分析需要清点与每个值相关联的记录数(作为每个计算的分子),并把这些除以数据集的总记录数(作为所有计算的分母),以便与任何个别值相关联的记录数被表示为占整个集合的百分比。百分比提供了比原始数字更易于理解的相对大小。百分比计算还有助于识别数据库中的其他关系。例如,具有相似分布的列可能在逻辑上彼此相关。
【出处】劳拉.塞巴斯蒂安-科尔曼 著,卢涛,李颖 译.数据质量测量持续改进.机械工业出版社,20164月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2026-1-2 22:50 , Processed in 0.085964 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心 备案图标.png 京公网安备11011102002767号 京ICP备2024094898号

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能职业认证中心

快速回复 返回顶部 返回列表