MySql查询优化

MySQL优化定义：从一定程度上减少MySQL的读写瓶颈，降低系统资源的浪费，并提升系统的性能。

SHOW STATUS语句解析

SHOW STATUS 语句能获取MySQL服务器的一些信息状态，主要是数据库性能性能参数。

SHOW [SESSION | GLOBAL] STATUS LIKE 'status_name'

SESSION：获取当前会话级别的性能参数
GLOBAL：获取全局级别的性能参数

如果省略不写，默认为SESSION。

SHOW STATUS语句支持的参数：

参数值	参数说明
Connections	连接MySQL服务器的次数
Uptime	MySQL服务器启动后连接工作的时间
Slow_queries	慢查询的次数
Com_insert	插入数据的次数，批量插入多条数据时，只累加1
Com_delete	删除数据的次数，每次累加1
Com_update	修改数据的次数，每次累加1
Com_select	查询数据的次数，一次查询操作累加1
Innodb_rows_read	查询数据时返回的记录数
Innodb_rows_inserted	插入数据时返回的记录数
Innodb_rows_updated	更新数据时返回的记录数
Innodb_rows_deleted	删除数据时返回的记录数

Comm_xxx 形式的参数表示SQL语句执行的次数
Innodb_rows_xxx 形式的参数表示在InnoDB存储引擎下，MySQL执行增删改查操作的次数。

EXPLAIN 语句解析

使用EXPLAIN语句来获取执行查询语句的信息，只需将EXPLAIN语句放在查询语句前即可。

EXPLAIN SELECT select_expr;

EXPLAIN：分析查询语句的关键字
SELECT：执行查询语句的关键字
select_expr：查询语句的查询选项

EXPLAIN 语句输出的各个列的作用如下

列明	描述
id	在一个大的查询语句中每个SELECT关键字都对应一个唯一的id
select_type	SELECT关键字对应的那个查询的类型
table	表名
partitions	匹配的分区信息
type	针对单表的访问方法
possible_keys	可能用到的索引
key	实际上使用的索引
key_len	实际使用到的索引长度
ref	当使用索引列等值查询时，与索引列进行等值匹配的对象信息
rows	预估的需要读取的记录条数
filtered	某个表经过搜索条件过滤后剩余记录条数的百分比
Extra	一些额外的信息

id

表示SELECT语句的序列号，有多少个SELECT语句就有多少个序列号。
select_type

当前SQL语句的查询类型，select_type常见的取值如下：
SIMPLE

当前SQL语句是简单查询，不包含任何连接查询和子查询。
PRIMARY

主查询或者是包含子查询时最外层的查询语句。
UNION

当前SQL语句为连接查询，表示连接查询的第二个SELECT语句或者是第二个后面的SELECT语句。
DEPENDENT UNION

与UNION含有相同，但是DEPENDENT UNION取决于外层的查询语句。
UNION RESULT

表示连接查询的结果信息。
SUBQUERY

表示子查询中的第一个查询语句。
DEPENDENT SUBQUERY

与SUBQUERY 含义相同，DEPENDENT SUBQUERY取决于外层的查询语句。
DERIVED

表示FROM子句中的子查询。
MATERIALIZED

表示实例化子查询。
UNCACHEABLE SUBQUERY

表示不缓存子查询的结果数据，重新计算外部查询的每一行数据。
UNCACHEABLE UNION

表示不缓存连接查询的结果数据，每次执行连接查询时都会重新计算数据结果。
table

当前查询所在的数据表。
partitions

如果当前数据表是分区表，则表示查询结果匹配的分区。
type

当前SQL语句所使用的关联类型或者访问类型，其取值从最优到最差依次排序为：system > const >eq_ref >ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range >index > All 。
system

查询的数据表中只有一行数据，是const类型的特例。
const

表中最多只有一行数据符合查询条件。当查询或连接的字段为主键或唯一索引时，则type的取值为const。
eq_ref

查询语句中的连接条件或查询条件使用了主键或者非空唯一索引包含的全部字段。则type的取值为eq_ref。典型场景：使用”=“操作符比较带索引的列。
ref

查询语句中连接条件或者查询条件使用的索引不是主键和非空唯一约束索引，或者只是一个索引的一部分，则type的取值为ref。典型场景：使用“=” 或者“<=>”操作符比较带有索引的列。
fulltext

当查询语句中的查询条件使用了全文索引时，type的取值为fulltext。
ref_or_null

类似与ref，但是查询语句的连接条件或者查询条件包含的列有NULL值时，MySQL会进行额外查询，经常被用于解析子查询。
index_merge

当查询语句使用索引合并优化时，type的取值为index_merge。key会显示使用到的所有索引，key_line显示使用到索引的最长键长值。
unique_subquery

查询语句的查询条件为IN的语句，并且IN语句中的查询字段为数据表的主键或者非空唯一索引字段时，type的取值为unique_subquery。
index_subquery

与unique_subquery 类似。IN语句中的查询字段为数据表中的非唯一索引字段。
range

查询语句的查询条件为使用索引检查数据表中的某个范围的记录时，type的取值为range。key会显示使用到的索引，key_line显示使用到索引的最长键长值。

典型场景：使用 =、<>、>、>=、<、<=、IS [NOT] NULL、<=> 、BETWEEN AND 或者IN操作时，用常量比较关键字的列。
index

查询语句中的查询条件使用的是覆盖索引，也就是说查询条件中的字段包含索引中的全部字段，并且按照索引中字段的顺序进行条件匹配，此时只需要扫描索引树即可。
ALL

每次进行连接查询时，都会进行全表的扫描。这种查询性能最差，一般情况下，需要添加索引来避免此类型的查询。
possible_keys

MySQL在执行查询语句时可能使用到的索引，但在实际查询中未必会使用到。当此列值为NULL时，说明MySQL没有可使用的索引，此时可以建立索引来提高查询性能。
key

执行查询语句时MySQL实际会使用到的索引，如果MySQLZ实际没有使用索引，则此列为NULL。
key_len

执行查询语句时MySQL实际会使用到的索引按照字节计算长度值。如果key为NULL,则key_len的值也为NULL。
ref

数据表中的哪个列或者哪个常量用来和key列中的索引做比较来检索数据。如果值此列值为func，则说明使用了某些函数的结果数据与key列的索引做比较来检索数据。
rows

MySQL查询数据时必须查找的数据行数，当数据表的存储引擎为InnoDB时，此值为MySQL的预估值。
filtered

查询结果符合查询条件的百分比。最小值为0，表示没有匹配条件的记录，最大值为100，表示数据表中所有行全部符合查询条件或者没有对数据进行过滤。
Extra

MySQL在执行查询语句时额外的详细信息。

SHOW PROFILE 解析

MySQL从5.0.37版本开始支持SHOW PROFILES语句 SHOW PROFILE语句。

可以使用如下命令MySQL是否支持PROFILE。

SELECT @@have_profiling;

结果显示，当前MySQL支持PROFILE。

MySQL中默认profiling是关闭的，如下查看：

SELECT @@profiling;

可以通过SET语句开启profiling，例如：

SET SESSION profiling=1;

当@@profiling状态为1，则说明开启了profiling。

开启之后可以使用SHOW PROFILES语句查看SQL语句信息。例如：

通过如下语句查看某条的SQL语句执行过程中所在线程的具体信息：

SHOW PROFILE FOR QUERY N;

N为执行SHOW PROFILES中的Query_ID。

关联查询优化

保证被驱动表的JOIN字段已经创建了索引
需要JOIN 的字段，数据类型保持绝对一致。
LEFT JOIN 时，选择小表作为驱动表，大表作为被驱动表。减少外层循环的次数。
INNER JOIN 时，MySQL会自动将小结果集的表选为驱动表。选择相信MySQL优化策略。
能够直接多表关联的尽量直接关联，不用子查询。(减少查询的趟数) 。
不建议使用子查询，建议将子查询SQL拆开结合程序多次查询，或使用 JOIN 来代替子查询。
衍生表建不了索引。

子查询优化

MySQL从4.1版本开始支持子查询，使用子查询可以进行SELECT语句的嵌套查询，即一个SELECT查询的结果作为另一个SELECT语句的条件。

子查询可以一次性完成很多逻辑上需要多个步骤才能完成的SQL操作。

子查询是 MySQL 的一项重要的功能，可以帮助我们通过一个 SQL 语句实现比较复杂的查询。

但是，子查询的执行效率不高。原因：

执行子查询时，MySQL需要为内层查询语句的查询结果建立一个临时表，然后外层查询语句从临时表中查询记录。查询完毕后，再撤销这些临时表。这样会消耗过多的CPU和IO资源，产生大量的慢查询。
子查询的结果集存储的临时表，不论是内存临时表还是磁盘临时表都不会存在索引，所以查询性能会受到一定的影响。
对于返回结果集比较大的子查询，其对查询性能的影响也就越大。

在MySQL中，可以使用连接（JOIN）查询来替代子查询。连接查询不需要建立临时表，其速度比子查询要快，如果查询中使用索引的话，性能就会更好。

尽量不要使用NOT IN 或者 NOT EXISTS，用LEFT JOIN xxx ON xx WHERE xx IS NULL替代

排序优化

问题：在 WHERE 条件字段上加索引，但是为什么在 ORDER BY 字段上还要加索引呢？

优化建议：

SQL 中，可以在 WHERE 子句和 ORDER BY 子句中使用索引，目的是在 WHERE 子句中避免全表扫描，在 ORDER BY 子句避免使用 FileSort 排序。当然，某些情况下全表扫描，或者 FileSort 排序不一定比索引慢。但总的来说，我们还是要避免，以提高查询效率。
尽量使用 Index 完成 ORDER BY 排序。如果 WHERE 和 ORDER BY 后面是相同的列就使用单索引列；如果不同就使用联合索引。
无法使用 Index 时，需要对 FileSort 方式进行调优。

GROUP BY优化

group by 使用索引的原则几乎跟order by一致，group by 即使没有过滤条件用到索引，也可以直接使用索引。
group by 先排序再分组，遵照索引建的最佳左前缀法则
当无法使用索引列，增大 max_length_for_sort_data 和 sort_buffer_size 参数的设置
where效率高于having，能写在where限定的条件就不要写在having中了
减少使用order by，和业务沟通能不排序就不排序，或将排序放到程序端去做。Order by、group by、distinct这些语句较为耗费CPU，数据库的CPU资源是极其宝贵的。
包含了order by、group by、distinct这些查询的语句，where条件过滤出来的结果集请保持在1000行以内，否则SQL会很慢。

优化分页查询

在索引上完成排序分页操作，最后根据主键关联回原表查询所需要的其他列内容。

EXPLAIN SELECT * FROM student t,(SELECT id FROM student ORDER BY id LIMIT 2000000,10)
a
WHERE t.id = a.id;

该方案适用于主键自增的表，可以把Limit 查询转换成某个位置的查询。

EXPLAIN SELECT * FROM student WHERE id > 2000000 LIMIT 10;