mysql的线程在获取到一条sql之后,会经过怎样的处理,然后得出你想要的结果呢?
首先,我们应该先了解mysql的体系结构
其次,我们应该理解各个部分的功能,以及sql中各个关键词的执行顺序
mysql的体系结构
下面引用一下mysql官方的体系结构图:
从上图可以看到各个组件之间的关系,以及负责的功能
mysql的体系结构包括以下几部分:
1. 线程池组件(Connection Pool):处理connetor发起的请求,处理用户登录、线程复用、连接数控制、内存检测和缓冲等功能
2. 管理服务和工具组件(Mangerment Services & Utilities)主要是完成数据备份和恢复、复制、集群管理、配置、迁移和元数据
3. SQL接口组件(Sql Interface):进行DML、DLL、视图、存储过程、触发器等操作和管理,通过sql命令来获取查询结果
4. 查询分析器组件(Parser):这里接受并通过解析器来解析sql接口组件传递过来的sql语句,解析器通过词法分析和语法分析等步骤来验证sql的正确性,解析器是由Lex和YACC实现的,是一个很长的脚本
主要功能:
a . 将SQL语句分解成数据结构,并将这个结构传递到后续步骤,以后SQL语句的传递和处理就是基于这个结构的
b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的
5. 优化器组件(Optimizer):用于优化查询sql
6. 缓冲组件(Cache&Buffer):将各个组件得出的结果缓冲起来,可以是查询结果,查询sql等等
7. 插件式存储引擎(Storage Engines):各种存储引擎插件,如myisam、innodb
8. 物理文件(Files & Logs):用于存储真正的数据,日志、索引和缓存等数据
那么,mysql是怎么执行一条sql的呢?其执行顺序是怎么样的?
大概是下面一个处理流程图
sql执行顺序
了解了mysql的体系结构之后,接下来我们看一下sql各个关键字的执行顺序
执行顺序如下:
- FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
- ON: 对虚表VT1进行ON筛选,只有那些符合<join-condition>的行才会被记录在虚表VT2中。
- JOIN: 如果指定了OUTER JOIN(比如left join、 right join),那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中,产生虚拟表VT3, rug from子句中包含两个以上的表的话,那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤,一直到处理完所有的表为止。
- WHERE: 对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中。
- GROUP BY: 根据group by子句中的列,对VT4中的记录进行分组操作,产生VT5.
- CUBE | ROLLUP: 对表VT5进行cube或者rollup操作,产生表VT6.
- HAVING: 对虚拟表VT6应用having过滤,只有符合<having-condition>的记录才会被 插入到虚拟表VT7中。
- SELECT: 执行select操作,选择指定的列,插入到虚拟表VT8中。
- DISTINCT: 对VT8中的记录进行去重。产生虚拟表VT9.
- ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作,产生虚拟表VT10.
- LIMIT:取出指定行的记录,产生虚拟表VT11, 并将结果返回
参考:
《MySQL技术内幕:SQL编程》