elasticsearch 笔记十五:相关度评分TF&IDF算法简介

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qzqanzc/article/details/83380134

算法介绍

relevance score ,就是计算出一个索引中的文本,与搜索文本,他们之间的关系,它们之间的关联匹配度是由Elasticsearch使用的 term frequency/inverse document frequency 算法,简称TF/IDF算法

Term frequency :搜索文本中的各个词条在field 文本中出现多少次,出现的次数越多,就越相关

Inverse document fruquency: 搜索文本中各个词条在整个索引的所有文档中出现了多少次,出现的次数越多就越不相关

Field-length norm:field长度,field越长,相关度越弱

猜你喜欢

转载自blog.csdn.net/qzqanzc/article/details/83380134