SequoiaDB巨杉数据库-评估策略

查询优化器会根据统计信息对候选访问计划进行评估,以此选取合适的访问计划来执行查询,详情见基于代价的访问计划评估

相等比较的选择率估算

  • 如果字段建立了唯一索引,则选择率为:selectivity = 1 / TotalRecords
  • 如果相等比较的值落入频繁数值集合中,假设命中下标为 i,则选择率为:selectivity = MCV.Frac[i]
  • 如果相等比较的值没有落入频繁数值集合中,则选择率为:selectivity = ( 1 - sum( MCV.Frac ) ) * 0.005

范围比较的选择率估算

  • 如果相等比较的范围落入频繁数值集合中,假设命中下标为 m 至 n,则选择率为:selectivity = MCV.Frac[m] + ... + MCV.Frac[n]
  • 如果相等比较的范围没有落入频繁数值集合中,则选择率为:selectivity = ( 1 - sum( MCV.Frac ) ) * 0.05

示例

如表中字段 val 建立了索引,生成该表的统计信息,字段 val 的频繁数值集合为:

MCV : {
  Val : [
    1, 2, 3, 4, 5, 6, 7, 8, 9
  ],
  Frac : [
    1000, 1200, 800, 1300, 700, 1000, 1000, 1000, 1000
  ]
}

Copy

  • 如果字段索引是唯一索引,相等条件选择率为:selectivity = 1 / TotalRecords
  • 如果字段索引是普通索引,相等条件{ val : { $et : 1 } } 命中频繁数值集合,其选择率为:selectivity = 0.1
  • 如果字段索引是普通索引,相等条件{ val : { $et : 10 } } 没有命中频繁数值集合,其选择率为:selectivity = 0.0005
  • 范围条件{ val : { $lt : 4 } } 命中了频繁数值集合的下标0、1 和 2,其选择率为:selectivity = 0.2
  • 范围条件{ val : { $gt : 9 } } 没有命中频繁数值集合,其选择率为:selectivity = 0.005

Note:

频繁数值的比例,每个值的取值范围为 0 ~ 10000,最终比例为(Frac / 10000) * 100%

更多信息请访问巨杉数据库官网

猜你喜欢

转载自blog.csdn.net/yanyanyanyanyanY/article/details/113119224