我有一个数据集,我需要找到k个最近的邻居,或者距离d内的所有邻居。该数据集定义了自定义距离,但它不是欧几里得距离。
我已经用过 metric trees 以前,主要是盖树。然而,在本例中,我的数据集将大于可用内存。那么,在磁盘存储的数据集上,是否有任何数据结构可以用于最近的邻居?对于这个操作,一个好的数据库索引也是有用的。