代码之家  ›  专栏  ›  技术社区  ›  Cinn smfoote

DBSCAN/光学算法中是否包含半径epsilon?

  •  0
  • Cinn smfoote  · 技术社区  · 6 年前

    The original paper 其他资源(维基百科)总是根据半径来定义一个核心对象(必须有大于 MinPts 邻居)使用类似的表达式 在内部 高达 .这就为解释这个半径是否包含这个半径留下了空间:如果距离(p,q)精确到μ,那么一个物体q是p的近邻吗?

    这显然非常重要,因为所有的定义都是基于这个…

    2 回复  |  直到 6 年前
        1
  •  1
  •   Cinn smfoote    6 年前

    原文中的定义 dbscan paper 因为邻里是距离(p,q)<=eps。但是,大多数实现将使用数据库索引支持的任何范围查询。在大多数情况下,这不会有什么不同,OMG是正确的,通过向EPS中添加最小的可代表数字,可以有效地将<更改为<=。

        2
  •  0
  •   OmG    6 年前

    我认为这一点都不重要。因为有不同的方法可以找到 epsilon 它们中没有一个是如此精确,而且还取决于您所聚类的数据的结构。

    此外,如果你改变 ε 比开发语言的精度稍高一点,就可以在指定的运行机器上解决这个问题,而且他们根本不是他们的邻居!因此,由于这个问题对机器的精度很敏感,这意味着在大多数一般情况下,它不能在最终结果中起到至关重要的作用。