找回密码
 立即注册
查看: 66|回复: 0

数据词典:ETL(Extract-Transform-Load)

[复制链接]

108

主题

1

回帖

478

积分

管理员

积分
478
发表于 2025-10-30 09:15:34 | 显示全部楼层 |阅读模式
ETL是英文Extract-Transform-Load的缩写,常用于数据仓库中的数据采集和预处理环节。顾名思义,ETL从原系统中抽取数据,并根据实际商务需求对数据进行转换,并把转换结果加载到目标数据存储中。可以看出,ETL既包含了数据采集环节,也包含了数据预处理环节。ETL的源和目标通常都是数据库和文件,但是也可以是其他类型的数据存储,比如消息队列。ETL是实现大规模数据初步加载的理想解决方案,它提供了高级的转换能力。ETL任务通常都是在“维护时间窗口”进行,在ETL任务执行期间,数据源默认不会发生变化,这就使得用户不必担忧ETL任务开销对数据源的影响,但同时也意味着,对于商务用户而言,数据和应用并非任何时候都是可用的。目前,市场上主流的ETL工具包括DataPipelineKettleTalendInformaticaDataxOracle Goldengate等。
【出处】林子雨.大数据导论.人民邮电出版社,20209月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 05:21 , Processed in 0.090714 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表