代码之家  ›  专栏  ›  技术社区  ›  PLB

对图像进行聚类以评估多样性(Weka?)

  •  1
  • PLB  · 技术社区  · 10 年前

    在大学课程中,我有一些图像特征(如 文本 文件)。我必须根据这些图像的多样性对其进行排序#

    我想到的想法是将图像输入k均值分类器,然后计算从簇内图像到簇中心的欧氏距离。然后在簇之间进行旋转,并始终拍摄离中心最近的(下一个)图像。一、 例如,返回最接近中心点1,然后返回最靠近中心点2,然后返回3……然后返回第二靠近中心点1、2、3,以此类推。

    第一个问题:这是一个聪明的方法吗?还是我走错了路?

    第二个问题:我有点困惑。我想我会把数据反馈给威卡,它会告诉我“嘿,如果我是你,我会把这些数据分成7个簇”,或者类似的东西。我的意思是,它可以给我一些关于我需要的集群的信息。相反,使用simplek意味着我应该事先知道我将使用多少簇……我怎么可能知道呢?

    我的意思的一个例子:假设我有3张单色图像:浅蓝色、蓝色、红色。 我想韦卡会注意到这两种蓝调是相似的,并将它们聚集在一起。

    顺便说一下,我对Weka有点陌生(你可能已经看到了),所以如果你能提供一些关于我可能想使用哪些功能的信息(以及为什么:P),我将非常感激! 非常感谢。

    1 回复  |  直到 10 年前
        1
  •  2
  •   bolec_kolec    10 年前

    简单K均值 -是一种算法,您必须指定数据集中可能的簇的数量。

    若你们不知道可能有多少个集群,那个么最好使用不同的算法或者找出一些集群。

    您可以使用 x-均值 -在那里你不需要指定 k 参数( http://weka.sourceforge.net/doc.packages/XMeans/weka/clusterers/XMeans.html )

    X-Means是由改进结构部分扩展的K-Means。在算法的这一部分中,尝试在其区域中分割中心。通过比较两个结构的BIC值,在每个中心的子中心和中心自身之间进行决策。

    或者你可以观察一个基于AHC-层次聚类算法的切点图( https://en.wikipedia.org/wiki/Hierarchical_clustering ) 然后扣除簇的数量