找回密码
 立即注册
查看: 35|回复: 0

数据词典:K-Means算法(K-Means Algorithm)

[复制链接]

1231

主题

74

回帖

4110

积分

管理员

积分
4110
发表于 2025-12-7 18:03:02 | 显示全部楼层 |阅读模式
K-Means算法是一个经典的聚类算法,它接受输入参数k,然后将n个数据对象划分为k个聚类,使所获得的聚类满足以下两个条件:
1.同一聚类中的对象之间的相似度较高;
2.不同聚类中的对象之间的相似度较小。
K-Means算法的基本步骤如下:
1.1步,在原始数据集中任意选择k个对象作为“初始聚类中心对象”,例如k=2
2.2步,计算其他对象与初始聚类中心对象之间的距离,并根据最小距离,将其他结点合并入对应的最小聚类中心结点所在的聚类,形成k=2个“中间聚类结果”;
3.3步,计算每个“中间聚类结果”的均值,在k中间聚类中找出k=2个“新的聚类中心对象”;
4.4步,重新计算每个对象与“新的聚类中心对象”之间的距离,并根据最小距离,重新分类,形成k=2个“中间聚类结果”;
5.5步,重复执行步骤34。当所有对象的聚类情况不再变化或已经达到规定的循环次数时,结束执行,并得到最终聚类结果。
【出处】朝乐门.数据科学,清华大学出版社,20168月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2026-1-3 05:53 , Processed in 0.082501 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心 备案图标.png 京公网安备11011102002767号 京ICP备2024094898号

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能职业认证中心

快速回复 返回顶部 返回列表