代码之家  ›  专栏  ›  技术社区  ›  n00dle

从克曼人身上找到每个星团的分布

  •  3
  • n00dle  · 技术社区  · 15 年前

    我试图检测一个输入向量在多大程度上适合一个给定的集群中心。我可以很容易地找到最佳匹配(到输入向量的欧几里得最小距离的中心是最好的),但是,我现在需要计算出匹配有多好。

    为此,我需要找到排列(标准偏差?)建立质心的向量,然后看看从输入向量到中心的距离是否小于排列。如果它超过了传播范围,我就不能说我没有适合它的簇(因为最好的簇并不适合输入向量)。

    我不知道如何找到每个集群的分布。我有所有的中心向量,所有的训练向量都用它们最接近的簇来标记,我只是不太清楚我需要做什么来获得传播。

    希望清楚?如果不是的话,我会努力修改的! 蒂亚 伊恩

    2 回复  |  直到 11 年前
        1
  •  4
  •   Joel    15 年前

    使用距离函数,计算从中心点到每个标记点的距离,然后算出这些距离的平均值。这会给你标准差。

        2
  •  1
  •   mattnedrich    11 年前

    如果切换到使用不同的算法,例如混合高斯算法,您将得到 传播 (例如,标准偏差)作为模型的一部分(聚类结果)。

    http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/mixture.html

    http://en.wikipedia.org/wiki/Mixture_model