我怎么能执行scikit学习内容剪影分数时修复的MemoryError?(How can I fix

2019-09-02 03:47发布

我运行一个聚类算法,并要评估使用的剪影评分结果scikit学习。 但在scikit学习,需要计算距离矩阵:距离= pairwise_distances(X,度量=度量,** kwds)

由于我的数据是300K秩序,我的内存是2GB,其结果是出现内存不足的事实。 我不能评价聚类结果。

有谁知道如何解决这个问题?

Answer 1:

设置sample_size在调用参数silhouette_score一些比300K较小的值。 使用该参数将样品从数据点X并计算silhouette_score那些,而不是整个阵列。



文章来源: How can I fix a MemoryError when executing scikit-learns silhouette score?