2021-07-29 19 分钟读完 (大约 2794 个字)

mysql

- 什么情况下索引失效
- InnoDB 支持的索引类型
- innodb 锁
- 平时怎么创建索引的
- B+树和 B 树的区别，和红黑树的区别
- 如何优化sql
- 什么是覆盖索引
- 为什么尽量不要用select *？
- 百万级数据分页查询优化
- mysql隔离级别
- MVCC, 什么是快照读，什么是当前读
- 什么是当前读
- mysql数据库事务隔离级别，分別解決什么问题，next-key锁原理、如何解决幻读？
- RR RC区别
- mysql其他
- 分库分表
- mysql的乐观锁、悲观锁实现
- 主从延迟怎么办
- binlog、redolog、undolog

- 什么情况下索引失效#

不符合联合最左匹配
like前导模糊查询（可以通过 REVERSE()函数来创建一个函数索引解决）
字段类型不匹配
索引字段施加函数
or的多个字段都要索引（只要有一个没有索引，就无法使用索引）
!= , <> is null, is not null, not in都会使索引失效
索引情况不好（索引列数据区分度太小，例如性别列），范围太大，扫表.

- InnoDB 支持的索引类型#

B+树索引：
全文索引：就是倒排索引
仅能再char、varchar、text类型的列上面创建全文索引
但是面对高级的搜索还是略显简陋，且性能问题也是担忧。
哈希索引：
哈希索引在InnoDB中只是一种系统自动优化的功能
Hash 索引仅仅能满足”=”,”IN”和”<>”查询，不能使用范围查询。
Hash 索引无法被用来避免数据的排序操作。
在MySQL运行的过程中，如果InnoDB发现，有很多SQL存在这类很长的寻路，并且有很多SQL会命中相同的页面(page)，InnoDB会在自己的内存缓冲区(Buffer)里，开辟一块区域，建立自适应哈希所有AHI，以加速查询。InnoDB的自使用哈希索引，更像“索引的索引”

- innodb 锁#

innodb 锁

- 平时怎么创建索引的#

选择区分度高的列做索引
根据查询场景、查询语句的查询条件设计索引
如果要为多列去创建索引，遵循最左匹配原则使用联合索引去创建
在长字符类型的字段上使用前缀索引，减少空间占用
扩展索引的时候尽量做追加，不是新建

- B+树和 B 树的区别，和红黑树的区别#

为什么不用B树?:
因为B树的所有节点都是包含键和值的,这就导致了每个几点可以存储的内容就变少了,出度就少了,树的高度会增高,查询的时候磁盘I/O会增多,影响性能。由于B+Tree内节点去掉了data域,因此可以拥有更大的出度,拥有更好的性能。

和红黑树:
B+树跟红黑树不用比，B+树的高很低，红黑树比不了。

- 如何优化sql#

让sql使用索引，如果查看sql使用索引情况，explain查看执行计划
通过explain命令可以得到下面这些信息: 表的读取顺序，数据读取操作的操作类型哪些索引可以使用哪些索引被实际使用，表之间的引用，每张表有多少行被优化器查询等信息。 rows是核心指标，绝大部分rows小的语句执行一定很快。
Extra字段几种需要优化的情况
Using filesort 需要优化，MYSQL需要进行额外的步骤来对返回的行排序。
Using temporary需要优化，发生这种情况一般都是需要进行优化的。mysql需要创建一张临时表用来处理此类查询
Using where 表示 MySQL 服务器从存储引擎收到行后再进行“后过滤”
如果让sql使用到索引（符合建索引的几个原则）
- 最左前缀匹配原则
- 选择区分度高的列作为索引，区分度的公式是count(distinct col)/count(*)
- 索引列不能参与计算，保持列“干净”，原因很简单，b+树中存的都是数据表中的字段值
- 尽量的扩展索引，不要新建索引
- =和in可以乱序

- 什么是覆盖索引#

覆盖索引就是把要查询出的列和索引是对应的，不做回表操作

- 为什么尽量不要用select *？#

返回了太多不需要的数据
无法覆盖索引（select * 走的是聚簇索引），需要回表
一个好的应用程序设计应当能够在 sql 中有准确的定义，从而减少歧义或者不必要的更改

- 百万级数据分页查询优化#

纯扫表：记录主键游标，记录上次最大主键Id，从该Id处开始扫
1
select * from t where id > max_id limit 100;
不记录游标只根据主键扫库, 不带where条件, 主键覆盖索引 + 子查询
1
select * from t where id in (select id from usertb limit 7000000,100);

带where条件，联合覆盖索引 key(type, id) + 子查询

1	select * from t where id in (select id from usertb where type=1 limit 7000000,100);

带where和orderby条件，联合覆盖索引key(a, b) + 子查询

1	select * from t where id in (select id from usertb where a=1 order by b limit 7000000,100);

尽量保证不要出现大的offset，加一些条件过滤一，不应该使用limit跳过已查询到的数据，offset做无用功。实际工程中，要避免出现大页码的情况，尽量引导用户做条件过滤。

mysql隔离级别#

- MVCC, 什么是快照读，什么是当前读#

快照读: 即普通SELECT语句，既然是快照读，故 SELECT 的时候，会生成一个快照。

生成快照的时机：事务中第一次调用SELECT语句的时候才会生成快照，在此之前事务中执行的update、insert、delete操作都不会生成快照。

不同事务隔离级别下，快照读的区别：

READ COMMITTED 隔离级别下，每次读取都会重新生成一个快照，所以每次快照都是最新的，也因此事务中每次SELECT也可以看到其它已commit事务所作的更改；

REPEATED READ 隔离级别下，快照会在事务中第一次SELECT语句执行时生成，只有在本事务中对数据进行更改才会更新快照，因此，只有第一次SELECT之前其它已提交事务所作的更改你可以看到，但是如果已执行了SELECT，那么其它事务commit数据，你SELECT是看不到的。

RC的本质：每一条SELECT都可以看到其他已经提交的事务对数据的修改，只要事务提交，其结果都可见，与事务开始的先后顺序无关。
RR的本质：第一条SELECT生成ReadView前，已经提交的事务的修改可见。

- 什么是当前读#

https://mp.weixin.qq.com/s/w1DwsDDSxKfmFxcLOgG3Dw

- mysql数据库事务隔离级别，分別解決什么问题，next-key锁原理、如何解决幻读？#

READ-UNCOMMITTED(未提交读): 可能会导致脏读、幻读或不可重复读
READ-COMMITTED(提交读): 可以阻止脏读，但是幻读或不可重复读仍有可能发生
REPEATABLE-READ(可重复读，mysql默认隔离级别): 可以阻止脏读和不可重复读，幻读通过mvcc解决了快照读，next-key锁解决了当前读
SERIALIZABLE(串行化读): 该级别可以防止脏读、不可重复读以及幻读

- RR RC区别#

区别就在于rr解决了不可重复读和幻读，怎么解决的，通过MVCC和next-key锁.

不可重复读：rc级别下的mvcc总是读取数据行的最新快照，而rr级别下的mvcc，会在事务第一次select的时候，为数据行生成一个快照，后面每次都读这个快照，除非自己更新，所以rr下是可重复读，别的事务提交也无法影响你的事务。

幻读：快照读下rr级别不会出现幻读，因为rr级别的mvcc读的是事务第一次读取时的快照；在当前读下rr级别使用了next-key锁（临键锁），临键锁包括行锁+间隙锁，来避免两个当前读时有其它事务插入数据，所以当前读使用next-key锁解决的幻读。最后备注下：如果是先快照读再当前读，影响行数不一致是否属于幻读，是有争议的但大多认为并不是幻读。

mysql其他#

- 分库分表#

根据userid取模做的分库分表

两个场景，业务解耦垂直拆分，读写性能瓶颈做水平拆分。

垂直切分

业务维度切分，解耦

水平切分

读写性能遇到瓶颈，分库分表

- mysql的乐观锁、悲观锁实现#

MySQL乐观锁的实现完全是逻辑的，也就是自己去实现。比如给每条数据附带版本号或者timestamp。更新引起数据的版本号改变，两次select判断版本号是否一致可以判断是否发生改变

MySQL悲观锁的实现需要借助于MySQL的锁机制。
行锁
常见的增删改（INSERT、DELETE、UPDATE）语句会自动对操作的数据行加写锁，查询的时候也可以明确指定锁的类型，SELECT … LOCK IN SHARE MODE 语句加的是读锁，SELECT … FOR UPDATE 语句加的是写锁
行锁的实现方式
1) Record lock 锁记录
2) Gap lock 锁两个记录之间的 GAP，防止记录插入
3) Next-key lock 锁一条记录及其之前的间隙

- 主从延迟怎么办#

主从延迟的原因：
主库写入数据并且生成binlog文件，从库异步读取更新

解决方案：
一、更新操作，做SQL优化，减少批量更新操作
二、查询场景，

强制读主，对主库压力大，谨慎使用
延迟读从, 将要更新的key先放到一个本地延迟队列中，做延迟处理。
聚合表, 如果是1:1的两张数据，可以先订阅更新到一张聚合表，再订阅聚合表的binlog
订阅全部从库的binlog, todo

- binlog、redolog、undolog#

binlog 一致性。用于主从复制和指定时间范围的数据恢复
redolog 保证持久性。log用于保证持久化，恢复在内存更新后，还没来得及刷到磁盘的数据
undolog 原子性。用于实现事务回滚和mvcc多版本并发控制