-
运行流程
用户在网页中输入关键字进行检索,关键字被solr接收,会对关键字进行分词,然后检索solr库中的资源,将符合要求的数据返回给用户
-
相关概念
- **基本存储单元:**文档
- 顺序扫描法: 根据需求挨个比较文档,找出所有符合要求的数据。效率低。
- ** 全文检索法:基于字段的代拍索引表的检索方式,效率高,适合大量数据。**
- ** 倒排索引:**根据某个字段分词后,产生的关键字和对应的文档之间的映射 关系表,称为倒排索引表(检索目录)
- **倒排表:**存储了关键字和文档之间的映射关系的表
- 词频: 关键字在该文档中出现的次数。
- 组件: 词条化工具
- 数据存储流程:
①存储数据到solr索引库
②给字段创建索引目录
③调用分词工具将字段的值进行分词
④创建倒排索引表。 - 数据的检索流程:
①solr调用分词工具,对检索关键字进行分词
②根据关键字分词后的结果,查询倒排索引表 获取对应的文档ID
③将符合要求的数据返回。