【笔记】《TiDB 源码阅读系列》6 Select 语句概览

快速笔记

语句及处理

建表：

CREATE TABLE t {
  id   VARCHAR(31),
  name VARCHAR(50),
  age  int,
  key id_idx (id)
};

select : 全表扫描+过滤，不考虑索引

SELECT name FROM t WHERE age > 10;

先放一下 Insert 的处理流程总结：

server/conn.go 监听端口，得到语句后进行处理，传给 session 包。
session/session.go 的 execute 函数包含了语句解析执行的三个核心流程。
调用 parse 包中的内容，将语句解析成抽象语法树，即 ast.InsertStmt 类型。
调用 execute/complie.go，转发给 planner 包处理，传回一个 Plan 接口类型，实际是 plannercore.Insert 类型。
调用 executor 包，在 executor/builder.go 中 Plan 被转换为了 executor.InsertExec 类型，即执行器。
使用 Next 函数来执行语句，INSERT 语句在返回前就会被执行，通过 table 包执行结果并写入到事务缓存中。
将 resultSet 返回给 server/conn.go（SELECT语句会在此时调用 Next 执行）。

SELECT 处理流程与 INSERT 的不同：

需要经过 Optimize，即将逻辑 plan 转换成物理 plan.
需要与存储引擎的计算模块交互，计算逻辑下推到存储节点
需要对客户端返回结果集数据

Parse

select 最终会被解析成 ast.SelectStmt 结构：

parser/ast/dml.go

770: // SelectStmt represents the select query node.
// See https://dev.mysql.com/doc/refman/5.7/en/select.html
type SelectStmt struct {
	dmlNode
	resultSetNode

	// SelectStmtOpts wraps around select hints and switches.
	*SelectStmtOpts
	// Distinct represents whether the select has distinct option.
	Distinct bool
	// From is the from clause of the query.
	From *TableRefsClause
	// Where is the where clause in select statement.
	Where ExprNode
	// Fields is the select expression list.
	Fields *FieldList
	// GroupBy is the group by expression list.
	GroupBy *GroupByClause
	// Having is the having condition.
	Having *HavingClause
	// WindowSpecs is the window specification list.
	WindowSpecs []WindowSpec
	// OrderBy is the ordering expression list.
	OrderBy *OrderByClause
	// Limit is the limit clause.
	Limit *Limit
	// LockTp is the lock type
	LockTp SelectLockType
	// TableHints represents the table level Optimizer Hint for join type
	TableHints []*TableOptimizerHint
	// IsAfterUnionDistinct indicates whether it's a stmt after "union distinct".
	IsAfterUnionDistinct bool
	// IsInBraces indicates whether it's a stmt in brace.
	IsInBraces bool
	// QueryBlockOffset indicates the order of this SelectStmt if counted from left to right in the sql text.
	QueryBlockOffset int
}

对于本文提到的语句SELECT name FROM t WHERE age > 10;

name 会被解析为 Fields 字段
WHERE age>10 会被解析为 Where 字段
FROM t 被解析为 From 字段

Plan

planner/core/logical_plan_builder.go

2267: func (b *PlanBuilder) buildSelect(ctx context.Context, sel *ast.SelectStmt) (p LogicalPlan, err error) {
2336: if sel.Where != nil {
		p, err = b.buildSelection(ctx, p, sel.Where, nil)
		if err != nil {
			return nil, err
		}
	}

701: func (b *PlanBuilder) buildSelection(ctx context.Context, p LogicalPlan, where ast.ExprNode, AggMapper map[*ast.AggregateFuncExpr]int) (LogicalPlan, error) {
709: selection := LogicalSelection{}.Init(b.ctx, b.getSelectOffset())
740: return selection, nil

在 buildSelect 方法中，ast.SelectStmt 被逐步转成一个 LogicalPlan，也就是 Plan 树，每一个语法元素都被转换成一个逻辑查询计划单元。

例如 WHERE 会被处理为一个 core.LogicalSelection 结构。

planner/core/logical_plans.go

330: // LogicalSelection 表示一个 where 或 having 谓词
type LogicalSelection struct {
	baseLogicalPlan
	// 最初，WHERE或ON条件被解析为单个表达式
	// 但是在我们转换为CNF（合取范式）后
	// 可以将其拆分为AND条件的列表。
	Conditions []expression.Expression
}

Conditions 代表了 Where 语句需要计算的表达式（若干个条件的 AND，即合取范式），当表达式值为 True 时，表明这一行符合条件。

因为 LogicalPlan 的很多字段都实现了 LogicalPlan 接口，所以我们认为把 AST 转换成了一个 Plan 树，下一步会在这个结构上进行优化。

Optimizing

planner/optimize.go

func optimize(ctx context.Context, sctx sessionctx.Context, node ast.Node, is infoschema.InfoSchema) (plannercore.Plan, types.NameSlice, float64, error) {
133: p, err := builder.Build(ctx, node) // plan
163: if !isLogicalPlan {
164: 	return p, names, 0, nil
172: finalPlan, cost, err := plannercore.DoOptimize(ctx, builder.GetOptFlag(), logic)
173: return finalPlan, names, cost, err

注意，回到 optimize 函数后，select 语句生成的 LogicalPlan 不会被163行捕获，会在172行进入 doOptimize 函数。
（补：在168行会有一个 Cascades 优化器的捕获判断，如果 session 中设置了使用 Cascades 优化，就会直接被捕获）

planner/core/optimizer.go

func DoOptimize(ctx context.Context, flag uint64, logic LogicalPlan) (PhysicalPlan, float64, error) {
119: logic, err := logicalOptimize(ctx, flag, logic)
126: physical, cost, err := physicalOptimize(logic)
131: return finalPlan, cost, nil

其中 logicalOptimize 和 physicalOptimize 分别代表逻辑优化和物理优化。

（下两节会做简要分析，下两篇会做具体分析。）

逻辑优化

逻辑优化由一系列规则组成，对于这些规则会按顺序不断应用到传入的 LogicalPlan Tree 中。

planner/core/optimizer.go

140: func logicalOptimize(ctx context.Context, flag uint64, logic LogicalPlan) (LogicalPlan, error) {
	var err error
	for i, rule := range optRuleList {
		// 标志顺序与列表中 optRule 的顺序相同
		// 我们使用位掩码来记录应使用的选择规则
		// 如果第i位为1，意味着我们应该应用第 i 个规则
		if flag&(1<<uint(i)) == 0 || isLogicalRuleDisabled(rule) {
			continue
		}
		logic, err = rule.optimize(ctx, logic)
		if err != nil {
			return nil, err
		}
	}
	return logic, err
}

const (
	flagPrunColumns uint64 = 1 << iota
	flagBuildKeyInfo
	flagDecorrelate
	flagEliminateAgg
	flagEliminateProjection
	flagMaxMinEliminate
	flagPredicatePushDown
	flagEliminateOuterJoin
	flagPartitionProcessor
	flagPushDownAgg
	flagPushDownTopN
	flagJoinReOrder
)

var optRuleList = []logicalOptRule{
	&columnPruner{},
	&buildKeySolver{},
	&decorrelateSolver{},
	&aggregationEliminator{},
	&projectionEliminator{},
	&maxMinEliminator{},
	&ppdSolver{},
	&outerJoinEliminator{},
	&partitionProcessor{},
	&aggregationPushDownSolver{},
	&pushDownTopNOptimizer{},
	&joinReOrderSolver{},
}

目前 TiDB 支持的优化规则见上，一个规则对应一个标志位。(1<<iota的写法是真的好看）

逻辑优化并不考虑数据分布，而是直接操作 Plan 树。大多数规则应用之后，一定会得到更好的 Plan.

举例来说，columnPruner （列裁剪）规则会将不需要的列裁剪掉。比如对于 select c from t; 语句，只需要返回 c 这一列的数据，就通过整个规则来实现。整个 Plan 树从树根到叶子节点递归调用整个规则，每层节点只保留上面节点所需要的列即可。

（看不懂gdlv中这里变量的表示形式，先跟着文章走）

经过逻辑优化，会得到一个查询计划：
在这里插入图片描述
其中 FROM t 变成了 DataSource 算子， WHERE age > 10 变成了 Selection 算子。（列被裁剪掉了？）

物理优化

在物理优化阶段，会考虑数据的分布，决定如何选择物理算子。比如对于 FROM t WHERE age > 10 语句，假设在 age 字段上有索引，需要考虑是全表扫描+过滤的方式快还是索引扫描的方式快。这个选择取决于统计信息，也就是 age>10 这个条件究竟能过滤掉多少数据。

planner/core/optimizer.go

func physicalOptimize(logic LogicalPlan) (PhysicalPlan, float64, error) {
163: if _, err := logic.recursiveDeriveStats(); err != nil {
174: t, err := logic.findBestTask(prop)

planner/core/stats.go

func (p *baseLogicalPlan) recursiveDeriveStats() (*property.StatsInfo, error) {
96: for i, child := range p.children {
97:		childProfile, err := child.recursiveDeriveStats()
104: return p.self.DeriveStats(childStats, p.self.Schema(), childSchema)

func (p *baseLogicalPlan) DeriveStats(childStats []*property.StatsInfo, selfSchema *expression.Schema, childSchema []*expression.Schema) (*property.StatsInfo, error) {

这里的 convert2PhysicalPlan 会递归调用下层节点的 convert2PhysicalPlan 方法，生成物理算子并且估算其代价，然后从中选择代价最小的方案，这两个函数比较重要：

recursiveDeriveStats 方法在整个 plan 树中递归调用，返回时调用 DeriveStats 方法。

（此处存疑：在干什么？plan树是一条链吗？）

planner/core/find_best_task.go

func (p *baseLogicalPlan) findBestTask(prop *property.PhysicalProperty) (bestTask task, err error) {

这里返回的结果是一个叫做 task 的结构，在 TiDB 中，Task 的定义是能在单个节点上不依赖于与其他节点进行数据交换即可进行的一系列操作。
planner/core/task.go

type task interface {
	count() float64
	addCost(cost float64)
	cost() float64
	copy() task
	plan() PhysicalPlan
	invalid() bool
}

由注释：

task 存储与 task 的 cost 相关的信息
task 可以是 CopTask, RootTask, MPPTask, ParallelTask
copTask 是运行在分布式 kv 存储中的 task，未来可能会拆成 indexTask 与 tableTask
rootTask 是 plan 图的汇聚节点，它在 tidb 上应该是一个单独的 goroutine.
文章：RootTask 是保留在 TiDB 中进行计算的那部分物理计划
项目中没有找到与 MPPTask 和 ParallelTask 有关的信息（存疑）

TiDB 的 Explain 结果中，每个 Operator 都会标明属于哪种 Task.

（先看完后面两篇再回来）

Little_Fall

发布了375 篇原创文章 · 获赞 305 · 访问量 7万+

私信关注