数据词典：K-Means算法（K-Means Algorithm）

赵老师 · 发表于 2025-12-7 18:03:02

K-Means算法是一个经典的聚类算法，它接受输入参数k，然后将n个数据对象划分为k个聚类，使所获得的聚类满足以下两个条件：

1．同一聚类中的对象之间的相似度较高；

2．不同聚类中的对象之间的相似度较小。

K-Means算法的基本步骤如下：

1．第1步，在原始数据集中任意选择k个对象作为“初始聚类中心对象”，例如k=2；

2．第2步，计算其他对象与初始聚类中心对象之间的距离，并根据最小距离，将其他结点合并入对应的最小聚类中心结点所在的聚类，形成k=2个“中间聚类结果”；

3．第3步，计算每个“中间聚类结果”的均值，在k中间聚类中找出k=2个“新的聚类中心对象”；

4．第4步，重新计算每个对象与“新的聚类中心对象”之间的距离，并根据最小距离，重新分类，形成k=2个“中间聚类结果”；

5．第5步，重复执行步骤3、4。当所有对象的聚类情况不再变化或已经达到规定的循环次数时，结束执行，并得到最终聚类结果。

【出处】朝乐门.数据科学,清华大学出版社,2016年8月第1版.

		自动登录	找回密码
密码			立即注册