MySQL 创建索引的几大原则 和 使用索引优化查询
文章目录
1、创建索引的几大原则
1.1、最左前缀匹配原则
mysql会一直向右匹配直到遇到范围查询 (>、<、between、like)
就停止匹配。
比如 a = 1 and b = 2 and c > 3 and d = 4
,如果建立 (a,b,c,d)
顺序的索引,d是用不到索引的,如果建立 (a,b,d,c)
的索引则都可以用到,a,b,d的顺序可以任意调整。
1.2、=和in可以乱序
比如 a = 1 and b = 2 and c = 3
建立(a,b,c)
索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式。
1.3、选择 区分度
高的列作为索引
区分度的公式是 count(distinct col)/count(*)
,表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。
1.4、索引列不能参与计算,保持列“干净”
比如 from_unixtime(create_time) = ’2014-05-29’
就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成 create_time = unix_timestamp(’2014-05-29’);
1.5、尽量的扩展索引,不要新建索引
比如表中已经有a的索引,现在要加 (a,b)
的索引,那么只需要修改原来的索引即可。
2、使用索引的典型场景
2.1、匹配全值
对索引中所有列都指定具体值,即对索引中的所有列都有等值匹配的条件。
#设置组合索引(rental_date,inventory_id,customer_id)为唯一索引。
EXPLAIN
SELECT *
FROM rental
WHERE rental_date = '2005-05-25 17:22:10'
AND inventory_id = 373
AND customer_id = 343 ;
2.2、匹配值的范围查询
对索引值进行范围查找。
#设置索引idx_fk_customer_id(customer_id)
EXPLAIN
SELECT *
FROM rental
WHERE customer_id >= 373
AND customer_id < 400 ;
2.3、匹配最左前缀
仅仅使用索引中的最左边列进行查询。比如组合索引(col1,col2,col3)能够被col1,col1+col2,col1+col2+col3的等值查询利用到的。
#创建索引idx_payment_date(payment_date,amount,last_update);
EXPLAIN
SELECT
*
FROM
payment
WHERE payment_date = '2006-02-14 15:16:03'
AND last_update = '2006-02-15 22:12:32' ;
从结果可以看出利用了索引,但又row为182行,所有只使用了部分索引。
EXPLAIN
SELECT *
FROM payment
WHERE amount = 3.98
AND last_update = '2006-02-15' ;
从结果看出,这次查询没有利用索引,进行了全表查找。
2.4、仅对索引查询进行查询
当查询列都在索引字段中。即select中的列都在索引中。
EXPLAIN
SELECT last_update
FROM payment
WHERE payment_date = '2005-08-19 21:21:47'
AND amount = 4.99 ;
extra部分Using index,说明不需要通过索引回表,Using index就是平时说的覆盖索引扫描(即找到索引,就找到了要查询的结果,不用再回表查找了)。
2.5、匹配列前缀
仅仅使用索引的第一列,并且只包含索引第1列的开头部分进行查找。
#创建索引 idx_title_desc_part(title(10),description(20));
EXPLAIN
SELECT title
FROM film_text
WHERE title LIKE 'AFRICAN%' ;
2.6、索引部分等值匹配,部分范围匹配
EXPLAIN
SELECT inventory_id
FROM rental
WHERE rental_date = '2006-02-14 15:16:03'
AND customer_id >= 300
AND customer_id <= 400 ;
type=ref,说明使用了索引。
2.7、列名是索引,is null,使用索引
EXPLAIN
SELECT *
FROM payment
WHERE rental_id IS NULL ;
3、索引存在,但不能使用索引的典型场景
3.1、以%开头的like查询
EXPLAIN
SELECT *
FROM actor
WHERE last_name LIKE '%NI%' ;
#优化
EXPLAIN
SELECT *
FROM
( SELECT actor_id
FROM actor
WHERE last_name LIKE '%NI%') a,
actor b
WHERE a.actor_id = b.actor_id ;
3.2、数据类型出现隐式转化
数据类型出现隐式转化,不会使用索引
EXPLAIN
SELECT *
FROM actor
WHERE last_name = 1 ;
#使用索引
EXPLAIN
SELECT *
FROM actor
WHERE last_name = '1' ;
3.3、组合索引,不满足最左原则
组合索引,不满足最左原则,不使用符合索引
EXPLAIN
SELECT *
FROM payment
WHERE amount = 3.98
AND last_update = '2006-02-15 22:12:32' ;
3.4、估计使用索引比全表扫描还慢
估计使用索引比全表扫描还慢,则不要使用索引
如查询以“S”开头的标题的电影,返回记录比例比较大,mysql预估索引扫描还不如全表扫描。
EXPLAIN
SELECT *
FROM film_text
WHERE title LIKE 'S%' ;
3.5、用or分割条件
用or分割条件,若or前后只要有一个列没有索引,就都不会用索引
EXPLAIN
SELECT *
FROM payment
WHERE customer_id = 203
OR amount = 3.96 ;