可能重复:
维数阵列集群
我有数字等的阵列[1, 20, 300, 45, 5, 60, 10, 270, 3]
什么是基于接近这些数字组合在一起,有效的算法? 在这种情况下,我期望类似[1, 3, 5]
[20, 45, 60]
和[270, 300]
可能重复:
维数阵列集群
我有数字等的阵列[1, 20, 300, 45, 5, 60, 10, 270, 3]
什么是基于接近这些数字组合在一起,有效的算法? 在这种情况下,我期望类似[1, 3, 5]
[20, 45, 60]
和[270, 300]
你所问最难的是如何真正界定接近。 你会希望输出从[5,10,15,20]
难道是相同的分组为[500,1000,1500,2000]
怎么样[1,2,3,5,7,8,9]
如果有一组或三个? (或两个?)。
怎么样[1,2,3,5,7,8,9,1075,4000]
难道1075和4000成为组合在一起? 请问较小的数字成为集团的样品中较大的数字变化?
这个问题是值得利用机器学习的整个场问: 聚类分析也许这相关的问题会有帮助吗?
我想你想要的是K-均值聚类 (有益链接到相关的问题),但你需要知道你要多少组数据分成不同的使用它。
这可能是巨大的矫枉过正,但你可能要考虑分层聚类算法 。 这些算法组一起值成层次结构,从中可以很容易地提取出最好的k个簇。 合并聚类可能是最简单的这些方法的实施,并从经验中也容易产生很好的集群。
希望这可以帮助!