in子句去重
的特性
为了解决这个问题,引入了半连接
的操作,将s1和s2进行半连接意思就是:对于s1中某条记录来说,只关心在s2表中是否存在匹配的记录,而不关心具备有多少个记录与之匹配 , 最终结果集只保留s1表中的记录
- Table pullout 子查询中表上拉
如果in中的子查询查询的是被驱动表的唯一索引,或者主键列时,直接将in子句优化为内连接
select * from s1 where key1 in (select f from s2 where key3='a')
如果f是主键或者唯一索引 , 那么直接优化为select s1.* from s1 inner join s2 on s1.key1 = s2.f where s2.key3 = 'a'
,因为f列中的值本身就是不重复的
- Duplicate weedout 重复值消除
还是优化为内连接,即使f列存在重复值,也直接执行查询 , 但是执行结果使用临时表存储驱动表的主键id,消除在子查询中查询到的重复值导致内连接产生重复行的问题
- LooseScan 松散扫描
首先将in优化成select s1.* from s1 inner join s2 on s1.key1 = s2.f where s2.key3 = 'a'
内连接 , 然后将s2作为驱动表,这时候先执行select f from s2 where s2.key3= 'a'
,可能得到多个重复的f,但是只取第一个去被驱动表s1中匹配,虽然是扫描索引,但是只取第一条记录执行匹配操作的方式称为松散扫描
- Semi-join Materialzation 半连接物化
就是上面提到的,将in中子查询查询结果物化成一张表,然后执行连接查询
- FirstMatch 首次匹配
这个也很好理解,相当于在嵌套循环连接中,先从外层查询中取一条记录 , 然后到子查询表中找到符合的记录,如果能找到一条那么加入到结果集并停止寻找多条 , 循环往复直到结束 。
推荐阅读
- 手机怎样连接我的电脑(手机怎么访问自己电脑)
- MYSQL-->InnoDB引擎底层原理
- 浅谈MySQL、Hadoop、BigTable、Clickhouse数据读写机制
- Docker | Compose创建mysql容器
- 一文读懂 MySQL 索引
- 如何优雅的备份MySQL数据?看这篇文章就够了
- 【博学谷学习记录】超强总结,用心分享|MySql连接查询超详细总结
- day08-MySQL事务
- MySQL 窗口函数
- 线上服务宕机,码农试用期被毕业,原因竟是给MySQL加个字段