|
关联规则最初是针对购物篮分析(Market Basket Analysis)问题提出的。假设零售商想更多地了解顾客的购物习惯。特别是,想知道顾客可能会在一次购物时同时购买哪些商品?为了回答该问题,可以对商店的顾客事物零售数量进行购物篮分析。该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁地被顾客同时购买,从而帮助他们开发更好的营销策略。 关联规则定义为:假设是I={I1,I2,I3,…,Im}项的集合。给定一个交易数据库D,其中每个事务t是I的非空子集,即每一个交易都与一个唯一的标识符TID对应。关联规则在D中的支持度是D中事务同时包含X、Y的百分比,即概率;置信度是D中事务已经包含X的情况下,包含Y的百分比,即条件概率。如果满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值是根据挖掘需要人为设定的。 【出处】林子雨.大数据导论.人民邮电出版社,2020年9月第1版.
|