有效地把相似的数字加在一起[复制](Efficiently grouping similar num

2019-08-05 00:04发布

可能重复:
维数阵列集群

我有数字等的阵列[1, 20, 300, 45, 5, 60, 10, 270, 3] 什么是基于接近这些数字组合在一起,有效的算法? 在这种情况下,我期望类似[1, 3, 5] [20, 45, 60][270, 300]

Answer 1:

你所问最难的是如何真正界定接近。 你会希望输出从[5,10,15,20] 难道是相同的分组为[500,1000,1500,2000]

怎么样[1,2,3,5,7,8,9] 如果有一组或三个? (或两个?)。
怎么样[1,2,3,5,7,8,9,1075,4000] 难道1075和4000成为组合在一起? 请问较小的数字成为集团的样品中较大的数字变化?

这个问题是值得利用机器学习的整个场问: 聚类分析也许这相关的问题会有帮助吗?

我想你想要的是K-均值聚类 (有益链接到相关的问题),但你需要知道你要多少组数据分成不同的使用它。



Answer 2:

这可能是巨大的矫枉过正,但你可能要考虑分层聚类算法 。 这些算法组一起值成层次结构,从中可以很容易地提取出最好的k个簇。 合并聚类可能是最简单的这些方法的实施,并从经验中也容易产生很好的集群。

希望这可以帮助!



文章来源: Efficiently grouping similar numbers together [duplicate]