信息检索导论学习笔记(三) 词词典及容错式检索

信息检索导论学习笔记(三) 词词典及容错式检索

1.词典搜索的数据结构

哈希表方式

查询速度快,但是无法处理前缀式查询

搜索树方式

注意搜索树的平衡性

2.通配符查询

(1)

反向B-树

通配符不出现在末尾的情况,出现在起始位置。

结合B-树和反向B-树

通配符在中间的情况

(2)

轮转索引

能查询通配符在中间的情况,但是词典会变大

k-gram索引

3.拼写校正

(1)编辑距离

(2)k-gram索引

4.基于发音的校正

相关文章
相关标签/搜索