计算机技术

2021年5月31日

如何用度量树实现通用的相似性查询

很多实际问题需要对有限集中的元素进行有效的识别,高效的算法通常可以避免对所有点进行遍历。很多相关问题将“邻近(proximity)”定义为排列空间中的距离测量。大量用来表示高维点的数据结构仅仅考虑了凸区域中的邻近查询(proximity queries).例如k-d树,但k-d树存在的问题是当维度超过O(log n)时,找不到一种分割方法可以区分所有坐标,这意味着对树的邻近搜索只能基于坐标的一个子集。目前对通用度量树划分平面的选择还没有被广泛研究。

进一步了解