在K-means聚类算法中,随机初始化和随机k值对算法的稳定性有重要影响。根据Kuncheva和Vetrov的研究,他们使用10个人工和10个真实数据集来研究集群稳定性与随机k和随机初始化的关系。他们发现,集群算法的稳定性被定义为集群算法对的调整Rand指数,平均在所有对之间。非对稳定性被定义为集群矩阵的熵。他们的结果显示,集群算法通常更稳定,尤其是对于较大的k值。他们还提出了一个新的稳定性指数,即对的稳定性和集群稳定性的总和,这个指数与集群的准确性更好地相关 。