mysql--sql的处理过程

mysql的线程在获取到一条sql之后，会经过怎样的处理，然后得出你想要的结果呢？

首先，我们应该先了解mysql的体系结构

其次，我们应该理解各个部分的功能，以及sql中各个关键词的执行顺序

mysql的体系结构

下面引用一下mysql官方的体系结构图：

从上图可以看到各个组件之间的关系，以及负责的功能

mysql的体系结构包括以下几部分：

1. 线程池组件（Connection Pool）：处理connetor发起的请求，处理用户登录、线程复用、连接数控制、内存检测和缓冲等功能

2. 管理服务和工具组件（Mangerment Services & Utilities）主要是完成数据备份和恢复、复制、集群管理、配置、迁移和元数据

3. SQL接口组件（Sql Interface）：进行DML、DLL、视图、存储过程、触发器等操作和管理，通过sql命令来获取查询结果

4. 查询分析器组件（Parser）：这里接受并通过解析器来解析sql接口组件传递过来的sql语句，解析器通过词法分析和语法分析等步骤来验证sql的正确性，解析器是由Lex和YACC实现的，是一个很长的脚本
主要功能：
a . 将SQL语句分解成数据结构，并将这个结构传递到后续步骤，以后SQL语句的传递和处理就是基于这个结构的
b. 如果在分解构成中遇到错误，那么就说明这个sql语句是不合理的

5. 优化器组件（Optimizer）：用于优化查询sql

6. 缓冲组件（Cache&Buffer）：将各个组件得出的结果缓冲起来，可以是查询结果，查询sql等等

7. 插件式存储引擎（Storage Engines）：各种存储引擎插件，如myisam、innodb

8. 物理文件（Files & Logs）：用于存储真正的数据，日志、索引和缓存等数据

那么，mysql是怎么执行一条sql的呢？其执行顺序是怎么样的?

大概是下面一个处理流程图

sql执行顺序

了解了mysql的体系结构之后，接下来我们看一下sql各个关键字的执行顺序

执行顺序如下：

FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
ON: 对虚表VT1进行ON筛选，只有那些符合<join-condition>的行才会被记录在虚表VT2中。
JOIN：如果指定了OUTER JOIN（比如left join、 right join），那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中，产生虚拟表VT3, rug from子句中包含两个以上的表的话，那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤，一直到处理完所有的表为止。
WHERE：对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中。
GROUP BY: 根据group by子句中的列，对VT4中的记录进行分组操作，产生VT5.
CUBE | ROLLUP: 对表VT5进行cube或者rollup操作，产生表VT6.
HAVING：对虚拟表VT6应用having过滤，只有符合<having-condition>的记录才会被插入到虚拟表VT7中。
SELECT：执行select操作，选择指定的列，插入到虚拟表VT8中。
DISTINCT：对VT8中的记录进行去重。产生虚拟表VT9.
ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作，产生虚拟表VT10.
LIMIT：取出指定行的记录，产生虚拟表VT11, 并将结果返回

参考：

《MySQL技术内幕：SQL编程》