Elsaticsearch倒排索引 - 代码天地

Elsaticsearch倒排索引

物联网 2023-10-02 17:22:00 阅读次数: 0

搜索引擎应该具有什么要求？

查询快

高效的压缩算法快速的编码和解码速度

结果准确

BM25 TF-IDF

检索结果丰富

召回率

面向海量数据，如何达到搜索引擎级别的查询效率？

索引

帮助快速检索
以数据结构为载体
以文件形式落地

倒排索引的数据结构

倒排索引

概念

一句话就是关键词到文档id的映射

倒排索引的基本数据结构

term_dictionary:词项字典不重复

Posting_List: 倒排表存词项的文档id int类型存储，为什么单个分片的倒排表有容量上限呢？就是因为int存储

term_index: 词项索引

当前的数据是一个十亿级别的数据，这时候我们词项字典有很多，这时候检索不久又麻烦了吗

这时候就延伸出了FST ，它实际上是trie的变种。这时候看这个图 10亿的数据导致倒排表存的id特多，所以倒排表对这个做了优化，如下图

词项字典存在tim文件中

词项索引存放在tip中

倒排表存在doc中

猜你喜欢

转载自blog.csdn.net/qq_52988841/article/details/132686297

Elsaticsearch倒排索引

倒排索引

正排索引与倒排索引

solr 倒排索引

spark实现倒排索引

MapReduce倒排索引

倒排索引原理

ElasticSearch 倒排索引、分词

Lucene倒排索引原理

倒排索引介绍

Elasticsearch 倒排索引 + 分词

HadoopMapReduce倒排索引

Lucerne倒排索引原理

倒排索引的实现

倒排索引的简单实现

MapReduce练习-----倒排索引

MapReduce--倒排索引

Inverted index 倒排索引

spark 例子倒排索引

关于倒排索引的理解

MapReduce的倒排索引

倒排索引与分词

全文搜索与倒排索引

elasticsearch倒排索引与分词

ES-倒排索引

【倒排索引】待定

倒排索引基础

对ElasticSearch倒排索引的理解

什么是倒排索引？

luence倒排索引解释

今日推荐

周排行

Java基础系列-Java11特性解读

前端面试查漏补缺--(十一) 前端软件架构模式MVC/MVP/MVVM

java Listener监听器

矩阵的迹

运用MVP实现二级联动

019基于JSP的学生考勤管理系统(MySQL版)

一道逻辑题 - 我拿走了哪个数

C# 通用单例窗体类

分布式之消息队列复习精讲【转】

Mac 使用.bash_profile

每日归档

更多

2024-07-11(0)

2024-07-10(0)

2024-07-09(0)

2024-07-08(0)

2024-07-07(0)

2024-07-06(0)

2024-07-05(0)

2024-07-04(0)

2024-07-03(0)

2024-07-02(0)