Apache Lucene 发布了最新的 9.1.0 版本,相比于 9.0 版本,该版本主要改进内容包括:
新特性
- Lucene JAR 采用 Java 模块化方式组织,提供模块描述和依赖信息
- 过滤器支持邻近向量搜索
- 标准的查询语法中支持内部查询
- 全新的令牌过滤器 SpanishPluralStemFilter 用于西班牙语复数的精确词干分析
优化
- 高维度向量的索引吞吐量提升 30%
- 高维度邻接向量搜索速度提升 10%
- 跨不同查询类型的 count 搜索速度更快
- 计算分类聚合信息时速度更快
- 其他小的搜索速度提升,包括改进了 PointRangeQuery, MultiRangeQuery 和 CoveringRangeQuery
其他
- 测试框架也做了模块化处理,所有包名改为 org.apache.lucene.tests.* 以避免包名冲突
- Lucene现在通过支持多个图形层,忠实地实现了最近邻搜索的HNSW算法
还有很多其他的小改进和 bug 修复,详细列表请看