查询优化器会根据统计信息对候选访问计划进行评估,以此选取合适的访问计划来执行查询,详情见基于代价的访问计划评估。
相等比较的选择率估算
- 如果字段建立了唯一索引,则选择率为:
selectivity = 1 / TotalRecords
- 如果相等比较的值落入频繁数值集合中,假设命中下标为 i,则选择率为:
selectivity = MCV.Frac[i]
- 如果相等比较的值没有落入频繁数值集合中,则选择率为:
selectivity = ( 1 - sum( MCV.Frac ) ) * 0.005
范围比较的选择率估算
- 如果相等比较的范围落入频繁数值集合中,假设命中下标为 m 至 n,则选择率为:
selectivity = MCV.Frac[m] + ... + MCV.Frac[n]
- 如果相等比较的范围没有落入频繁数值集合中,则选择率为:
selectivity = ( 1 - sum( MCV.Frac ) ) * 0.05
示例
如表中字段 val 建立了索引,生成该表的统计信息,字段 val 的频繁数值集合为:
MCV : {
Val : [
1, 2, 3, 4, 5, 6, 7, 8, 9
],
Frac : [
1000, 1200, 800, 1300, 700, 1000, 1000, 1000, 1000
]
}
Copy
- 如果字段索引是唯一索引,相等条件选择率为:
selectivity = 1 / TotalRecords
- 如果字段索引是普通索引,相等条件
{ val : { $et : 1 } }
命中频繁数值集合,其选择率为:selectivity = 0.1
- 如果字段索引是普通索引,相等条件
{ val : { $et : 10 } }
没有命中频繁数值集合,其选择率为:selectivity = 0.0005
- 范围条件
{ val : { $lt : 4 } }
命中了频繁数值集合的下标0、1 和 2,其选择率为:selectivity = 0.2
- 范围条件
{ val : { $gt : 9 } }
没有命中频繁数值集合,其选择率为:selectivity = 0.005
Note:
频繁数值的比例,每个值的取值范围为 0 ~ 10000,最终比例为(Frac / 10000) * 100%
更多信息请访问巨杉数据库官网