找回密码
 立即注册
查看: 77|回复: 0

数据词典:数据转换(Data Conversion)

[复制链接]

108

主题

1

回帖

478

积分

管理员

积分
478
发表于 2025-10-29 07:37:49 | 显示全部楼层 |阅读模式
数据转换就是将数据进行转换或归并,从而构成一个适合数据处理的描述形式。常见的数据转换策略包括:
1)平滑处理。帮助除去数据中的噪声,常用的方法包括分箱、回归和聚类等。
2)聚集处理。对数据进行汇总操作。例如,每天的数据经过汇总操作可以获得每月或每年的总额。这一操作常用于构造数据立方体或对数据进行多粒度的分析。
3)数据泛化处理。用更抽象(更高层次)的概念来取代低层次的数据对象。例如,街道属性可以泛化到更高层次的概念,如城市、国家,再比如年龄属性可以映射到更高层次的概念,如年轻、中年和老年。
4)规范化处理。将属性值按比例缩放,使之落入一个特定的区间,比如0.0~1.0。常用的数据规范化方法包括Min-Max规范化、Z-Score规范化和小数定标规范化等。
5)属性构造处理。根据已有属性集构造新的属性,后续数据处理直接使用新增的属性。例如,根据已知的质量和体积属性,计算出新的属性——密度。
【出处】林子雨.大数据导论.人民邮电出版社,20209月第1

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 06:45 , Processed in 0.092191 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表