网站首页 > 教程文章 正文
前言:
在数据库中,JOIN 是一种操作,用于将多个表中的数据联接起来。通过 JOIN 操作,可以根据表之间的关联关系,将相关联的数据合并到一起,以便进行更复杂的查询和分析。那么为什么不推荐使用多表进行join关联查询呢?
分析
之所以不建议使用join查询,最主要的原因就是join的效率比较低。
MVSQL是使用了嵌套循环(Nested-Loop Join)的方式来实现关联查询的,简单点说就是要通过两层循环用第一张表做外循环,第二张表做内循环,外循环的每一条记录跟内循环中的记录作比较,符合条件的就输出。
而具体到算法实现上主要有simple nested loop,block nested loop和index nested loop这三种。而且这种的效率都没有特别高。
MySQL是使用了嵌套循环(Nested-Loop Join)的方式来实现关联查询的,如果有2张表join的话,复杂度最高是O(n^2),3张表则是O(n^3).随着表越多,表中的数据量越多,JOIN的效率会呈指数级下降。
PS:MySQL8.0中新增了 hash join算法。
扩展说明
在MySQL中,可以使用JOIN 在两个或多个表中进行联合查询,join有三种,分别是inner join、leftjoin 和right join。
INNER JOIN(内连接,或等值连接):获取两个表中字段匹配关系的记录。取两个表的交集部分。
LEFT JOIN(左连接):获取左表所有记录,即使右表没有对应匹配的记录。取两个表的交集部分+左表中的数据。
RIGHT JOIN(右连接):与LEFTJOIN 相反,用于获取右表所有记录,即使左表没有对应匹配的记录。取两个表的交集部分+右表中的数据。
在配合join一起使用的还有on关键字,用来指明关联查询的一些条件。
嵌套循环算法
MVSQL是使用了嵌套循环(Nested-Loop Join)的方式来实现关联查询的,具体到算法上面主要有simplenested loop join, block nested loop join和index nested loop join这三种。
而这三种的效率都没有特别高。
simple nested loop,他的做法简单粗暴,就是全量扫描连接两张表进行数据的两两对比,所以他的复杂度可以认为是N*M。
N是驱动表的数量,M是被驱动表的数量。
- index nested loop,当lnner Loop的表用到字段有索引的话,可以用到索引进行查询数据,因为索引是香B+树的,复杂度可以近似认为是N*logM。
- block nested loop,其实是引入了一个Buffer,会提前把外循环的一部分结果提前放到JOIN BUFFER中然后内循环的每一行都和整个buffer的数据作比较。虽然比较次数还是N*M,但是因为join buffer是基于内存的,所以效率高很多。
所以,虽然MySQL已经尽可能的在优化了,但是这几种算法复杂度都还是挺高的,这也是为什么不建议在数据库中多表JOIN的原因。随着表越多,表中的数据量越多,JOIN的效率会呈指数级下降。
不能用join如何做关联查询
如果不能通过数据库做关联查询,那么需要查询多表的数据的时候要怎么做呢?
主要有两种做法:
- 在内存中自己做关联,即先从数据库中把数据查出来之后,我们在代码中再进行二次查询,然后再进行关联。
- 数据冗余,那就是把一些重要的数据在表中做冗余,这样就可以避免关联查询了。
- 宽表,就是基于一定的join关系,把数据库中多张表的数据打平做一张大宽表,可以同步到ES或者干脆直接在数据库中直接查都可以。
总结
上面对sql语句中join语句使用以及不推荐使用做了说明,在项目中尽量减少使用join进行关联查询。
- 上一篇: 什么是算法?
- 下一篇: PostgreSQL技术内幕25:时序数据库插件TimescaleDB
猜你喜欢
- 2025-03-07 深入解析MySQL索引高速查询的核心机制与原理
- 2025-03-07 每个人都需要了解的索引知识点
- 2025-03-07 C++ B-tree:探索数据结构之美
- 2025-03-07 Java面试核心技能全景解析:架构设计与编码能力的深度碰撞
- 2025-03-07 图文并茂 10分钟深度剖析数据库索引
- 2025-03-07 详细介绍一下MySQL中的复合索引?
- 2025-03-07 程序员必须掌握的8种数据结构: 1.数组: 数组
- 2025-03-07 PostgreSQL技术内幕25:时序数据库插件TimescaleDB
- 2025-03-07 什么是算法?
- 2025-03-07 数据结构——第7章-查找
- 最近发表
-
- 绝区零:公测必看!300菲林兑换码、萌新补给一览!切勿踩坑!
- 事半功倍 轻松制作可交互移动原型
- LOL英雄联盟美服注册教材 教你玩转美服
- 「正点原子Linux连载」第五十八章Linux INPUT子系统实验(一)
- 如何轻松薅Cursor羊毛:用免手机号邮箱快速注册
- C/C++基础语法复习(一):C++与C语言的区别,主要有这些
- 永久免费的高配容器Clawcloud,超爽体验!
- Spaceship低价注册域名 | 每年5元不到 | XYZ域名 | 托管cloudflare
- 云杉网络DeepFlow基于Free5GC的方案示例
- alma8飞速搭建zabbix6、微信报警、windows、linux、交换机监控
- 标签列表
-
- location.href (44)
- document.ready (36)
- git checkout -b (34)
- 跃点数 (35)
- 阿里云镜像地址 (33)
- qt qmessagebox (36)
- md5 sha1 (32)
- mybatis plus page (35)
- semaphore 使用详解 (32)
- update from 语句 (32)
- vue @scroll (38)
- 堆栈区别 (33)
- 在线子域名爆破 (32)
- 什么是容器 (33)
- sha1 md5 (33)
- navicat导出数据 (34)
- 阿里云acp考试 (33)
- 阿里云 nacos (34)
- redhat官网下载镜像 (36)
- srs服务器 (33)
- pico开发者 (33)
- https的端口号 (34)
- vscode更改主题 (35)
- 阿里云资源池 (34)
- os.path.join (33)