环境:
Oracle
慢sql:
select *
from A a left join B b on a.id=b.id
where b.id is null AND 其他条件
表数据量:
A表数据量在300万,B表数据在30万,查询时间为9s左右
问题分析
- 虽然b表id已经存在索引,但是Oracle在使用is null 或者 is not null 时是不会走索引的。
- A表数据量远大于B表,理论上使用B表驱动A表比较合适。
优化
- 可使用not exists替换is null,sql如下:
select *
from A a
where not exists (select 1 from B b where a.id=b.id) AND 其他条件
替换后,还是A表驱动B表。(另外如果此时能使用in,那么就是B表驱动A表)
替换后sql执行时间优化到0.2秒
以上分析都是基于个人对sql执行的理解,可能并不对,因为让我感到莫名其妙的是,在换一台机器造量级相同的数据,发现以上两个sql执行计划的成本竟然一模一样:都是全表扫描A表,使用B表主键索引,然后hash join。
如有理解不当或者有大佬理解其中的奥妙,还请多多指教,感谢!