找回密码
 立即注册
查看: 38|回复: 0

数据词典:探索性数据分析(Exploratory Data Analysis)

[复制链接]

1231

主题

74

回帖

4110

积分

管理员

积分
4110
发表于 2025-11-24 18:49:19 | 显示全部楼层 |阅读模式
探索性数据分析(Exploratory Data AnalysisEDA)是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,并通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。当我们对数据中的信息没有足够的经验,且不知道该用何种传统统计方法进行分析时,经常采用探索性数据分析进行数据分析。
EDA方法与传统统计学中的验证性分析方法不同,二者的主要区别如下:
1.EDA不需要事先假设,而验证性分析需要事先提出假设。
2.EDA中采用的方法往往比验证性分析简单。EDA常用的统计量包括众数、中位数、四分位数、和、平均值、极差、标准差、方差、极小值、极大值等。当然,还可运用简单且直观的茎叶图、箱线图、残差图、字母值、数据变换、中位数平滑等进行探索性分析。可见,相对于传统验证性分析方法,EDA更为简单、易学和易用。
3.在一般数据科学项目中,探索分析在先,而验证性分析在后。通常,基于EDA的数据分析工作可分为两个阶段:探索性分析和验证性分析阶段,即先做探索性数据分析,然后根据EDA得出的数据结构和模式特征,提出假设,并选择合适的验证性分析方法。
【出处】朝乐门.数据科学,清华大学出版社,20168月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2026-1-3 04:18 , Processed in 0.079866 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心 备案图标.png 京公网安备11011102002767号 京ICP备2024094898号

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能职业认证中心

快速回复 返回顶部 返回列表