K-means聚类算法在基因表达数据的癌症亚型预测中产生差异的主要因素是其非确定性的特性。这种非确定性源于算法随机选择数据点作为初始质心的方式。这种随机性限制了其在如癌症亚型预测这样的领域的应用,因为这使得很难合理地比较这种算法的结果与其他算法的结果 。