有效地把相似的数字加在一起[复制](Efficiently grouping similar num

2019-08-05 00:04发布

可能重复：
维数阵列集群

我有数字等的阵列[1, 20, 300, 45, 5, 60, 10, 270, 3] 什么是基于接近这些数字组合在一起，有效的算法？在这种情况下，我期望类似[1, 3, 5] [20, 45, 60]和[270, 300]

Answer 1:

你所问最难的是如何真正界定接近。你会希望输出从[5,10,15,20] 难道是相同的分组为[500,1000,1500,2000]

怎么样[1,2,3,5,7,8,9] 如果有一组或三个？（或两个？）。
怎么样[1,2,3,5,7,8,9,1075,4000] 难道1075和4000成为组合在一起？请问较小的数字成为集团的样品中较大的数字变化？

这个问题是值得利用机器学习的整个场问：聚类分析也许这相关的问题会有帮助吗？

我想你想要的是K-均值聚类（有益链接到相关的问题），但你需要知道你要多少组数据分成不同的使用它。

这可能是巨大的矫枉过正，但你可能要考虑分层聚类算法 。这些算法组一起值成层次结构，从中可以很容易地提取出最好的k个簇。合并聚类可能是最简单的这些方法的实施，并从经验中也容易产生很好的集群。

希望这可以帮助！

文章来源: Efficiently grouping similar numbers together [duplicate]