计算机科学

2022年2月22日

06 Hash Table

数据库系统中记录被保存在页中,为了能找到某条记录保存在那一页,需要一些数据结构保存两者之间的映射关系。哈希表是常用的索引结构之一。

进一步了解
2021年12月11日

GNAT:大度量空间中的近邻搜索

基因序列比对、声音识别、图片识别等数据都在分布上存在一定关联性,利用这些关联性可以提升近邻搜索的性能。为了达到这个目的,要求数据结构能够反映数据的内在几何特征。GNAT通过在多个层次上将数据分割为多个区域来保留基本几何结构。

进一步了解
2021年5月31日

如何用度量树实现通用的相似性查询

很多实际问题需要对有限集中的元素进行有效的识别,高效的算法通常可以避免对所有点进行遍历。很多相关问题将“邻近(proximity)”定义为排列空间中的距离测量。大量用来表示高维点的数据结构仅仅考虑了凸区域中的邻近查询(proximity queries).例如k-d树,但k-d树存在的问题是当维度超过O(log n)时,找不到一种分割方法可以区分所有坐标,这意味着对树的邻近搜索只能基于坐标的一个子集。目前对通用度量树划分平面的选择还没有被广泛研究。

进一步了解