找回密码
 立即注册
查看: 37|回复: 0

数据词典:关联规则(Association Rules)

[复制链接]

1231

主题

74

回帖

4110

积分

管理员

积分
4110
发表于 2025-12-6 19:18:56 | 显示全部楼层 |阅读模式
关联规则最初是针对购物篮分析(Market Basket Analysis)问题提出的。假设零售商想更多地了解顾客的购物习惯。特别是,想知道顾客可能会在一次购物时同时购买哪些商品?为了回答该问题,可以对商店的顾客事物零售数量进行购物篮分析。该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁地被顾客同时购买,从而帮助他们开发更好的营销策略。
关联规则定义为:假设是I={I1,I2,I3,,Im}项的集合。给定一个交易数据库D,其中每个事务tI的非空子集,即每一个交易都与一个唯一的标识符TID对应。关联规则在D中的支持度是D中事务同时包含XY的百分比,即概率;置信度是D中事务已经包含X的情况下,包含Y的百分比,即条件概率。如果满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值是根据挖掘需要人为设定的。
【出处】林子雨.大数据导论.人民邮电出版社,20209月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2026-1-3 02:09 , Processed in 0.074753 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心 备案图标.png 京公网安备11011102002767号 京ICP备2024094898号

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能职业认证中心

快速回复 返回顶部 返回列表