K-means聚类算法的非确定性特性可能会限制其在癌症亚型预测中的应用。这种非确定性主要源于算法随机选择数据点作为初始质心的方式。这种随机性使得在相同数据集上多次执行可能会得到不同的结果,因此很难合理地将这种算法的结果与其他算法的结果进行比较。然而,一种改进的、基于密度的K-means版本提出了一种新颖且系统的方法来选择初始质心,该算法选择属于密集区域并在特征空间中适当分离的数据点作为初始质心,从而提高了预测癌症亚型的准确性 。