代码之家 › 专栏 › 技术社区 › PLB

对图像进行聚类以评估多样性(Weka?)

k-means weka cluster-analysis java

PLB · 技术社区 · 10 年前

在大学课程中,我有一些图像特征(如文本文件)。我必须根据这些图像的多样性对其进行排序#

我想到的想法是将图像输入k均值分类器,然后计算从簇内图像到簇中心的欧氏距离。然后在簇之间进行旋转,并始终拍摄离中心最近的(下一个)图像。一、例如,返回最接近中心点1,然后返回最靠近中心点2,然后返回3……然后返回第二靠近中心点1、2、3,以此类推。

第一个问题:这是一个聪明的方法吗?还是我走错了路?

第二个问题:我有点困惑。我想我会把数据反馈给威卡,它会告诉我“嘿,如果我是你,我会把这些数据分成7个簇”,或者类似的东西。我的意思是,它可以给我一些关于我需要的集群的信息。相反,使用simplek意味着我应该事先知道我将使用多少簇……我怎么可能知道呢?

我的意思的一个例子:假设我有3张单色图像:浅蓝色、蓝色、红色。我想韦卡会注意到这两种蓝调是相似的,并将它们聚集在一起。

顺便说一下,我对Weka有点陌生(你可能已经看到了),所以如果你能提供一些关于我可能想使用哪些功能的信息(以及为什么:P),我将非常感激! 非常感谢。

1 回复 | 直到 10 年前

bolec_kolec 10 年前

简单K均值 -是一种算法,您必须指定数据集中可能的簇的数量。

若你们不知道可能有多少个集群,那个么最好使用不同的算法或者找出一些集群。

X-Means是由改进结构部分扩展的K-Means。在算法的这一部分中,尝试在其区域中分割中心。通过比较两个结构的BIC值,在每个中心的子中心和中心自身之间进行决策。

或者你可以观察一个基于AHC-层次聚类算法的切点图( https://en.wikipedia.org/wiki/Hierarchical_clustering ) 然后扣除簇的数量

推荐文章

Ian Siñel · WEKA中的神经网络

8 年前

HAMZA ELRHAZI · 如何在Java中使用Weka API将字符串属性转换为标称属性

8 年前

Syahnur Nizam · 使用Weka作为引擎的基于PHP的网站

8 年前

Ricardo Cruz · 删除标称属性=值的实例(Weka GUI)

8 年前

Siwoku Adeola · 用于(moa PairedLearners)的示例代码

8 年前

Luiz · 无法使用Weka连接到MySQL

8 年前

Claire · Matlab中的J48决策树,使用Weka作为API

8 年前

user3394131 · Graphviz和Weka只生成空树

8 年前

CCCodes · 如何在Weka中使用MFCC进行音频分类?

8 年前

weidler · 不同变量集的配对T检验

9 年前