我运行一个聚类算法,并要评估使用的剪影评分结果scikit学习。 但在scikit学习,需要计算距离矩阵:距离= pairwise_distances(X,度量=度量,** kwds)
由于我的数据是300K秩序,我的内存是2GB,其结果是出现内存不足的事实。 我不能评价聚类结果。
有谁知道如何解决这个问题?
我运行一个聚类算法,并要评估使用的剪影评分结果scikit学习。 但在scikit学习,需要计算距离矩阵:距离= pairwise_distances(X,度量=度量,** kwds)
由于我的数据是300K秩序,我的内存是2GB,其结果是出现内存不足的事实。 我不能评价聚类结果。
有谁知道如何解决这个问题?
设置sample_size
在调用参数silhouette_score
一些比300K较小的值。 使用该参数将样品从数据点X
并计算silhouette_score
那些,而不是整个阵列。