找回密码
 立即注册
查看: 40|回复: 0

数据词典:数据挖掘(Data Mining)

[复制链接]

656

主题

70

回帖

2291

积分

管理员

积分
2291
发表于 2025-11-7 13:19:08 | 显示全部楼层 |阅读模式
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘可以视为机器学习与数据库的交叉,它主要利用机器学习界提供的算法来分析海量数据,利用数据库界提供的存储技术来管理海量数据。从知识的来源角度而言,数据挖掘领域的很多知识也“间接”来自于统计学界,之所以说“间接”,是因为统计学界一般偏重于理论研究而不注重实用性,统计学界中的很多技术需要在机器学习界进行验证和实践并变成有效的机器学习算法以后,才可能进入数据挖掘领域,对数据挖掘产生影响。
虽然数据挖掘的很多技术都来自机器学习领域,但是,我们并不能因此就认为数据挖掘只是机器学习的简单应用。毕竟,机器学习通常只研究小规模的数据对象,往往无法应用到海量数据的情形,数据挖掘领域必须借助于海量数据管理技术对数据进行存储和处理,同时对一些传统的机器学习算法进行改进,使其能够支持海量数据的情形。
典型的数据挖掘算法包括分类、聚类、回归分析和关联规则等。
【出处】林子雨.大数据导论.人民邮电出版社,20209月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 05:07 , Processed in 0.095638 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表