百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

MySQL分组查询后如何获取每组的前N条数据,你会吗?

csdh11 2025-01-02 15:30 23 浏览

“分组查询”可以说是相当常见的SQL查询语句,对于MySQL数据库而言,其实现分组查询的关键字为GROUP BY,而在使用GROUP BY期间一般还会有其他的聚合函数配合使用,比如计数用的COUNT(*),统计数值和用的SUM(*),而本文要介绍的是另一种类型的“分组查询”,即分组查询出来后再查询出每一组的前N条数据。

为了方便诸位理解,还是直接举一个实际的案例吧:存在两个数据库表,一个叫课程表course,另一个叫课程类型表course_type,这两个数据库表的DDL(数据库表字段定义)如下所示:

(1)课程类型表:

CREATE TABLE `course_type` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) CHARACTER SET utf8mb4 NOT NULL COMMENT '类型名',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程类型';

(2)课程信息表:

CREATE TABLE `course` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `type_id` int(11) NOT NULL COMMENT '类型id',
  `name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL COMMENT '课程名称',
  `scan_total` int(255) DEFAULT NULL COMMENT '课程浏览量',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程信息表';

现在的需求为:找出每种课程类型中课程浏览量排名前3的课程记录 ,而这种场景经常可以在一些在线教育平台中见到,如下图所示为某个在线教育平台中“后端开发”这一大类型里面每种小分类的课程销量排行榜:

接下来,我们将找寻各种方式去实现这一功能需求!

(1)传统的实现方式一般是采用Java代码的方式先查询出每种课程类型数据,然后再遍历每一种课程类型,在课程表中根据课程类型匹配查询出浏览量前3的课程数据,即 type_id=xx order by scan_total desclimit 3;

其代码实现方式在这里就不贴出来了,感兴趣的小伙伴可以自己动手撸一撸!

此种实现方式最终固然可以实现功能需求,但是,有一个不好的地方在于需要在遍历每一种课程类型时不断发出查询课程数据列表的SQL,如果课程类型有10几种,而每一种需要取几十、甚至几百条数据,那将耗费很大的资源(建立数据库链接是需要耗资源的:内存、CPU、网络、磁盘…)

(2)因此,我们转而求其次,采用SQL查询一次性来搞定!在进行实操之前,debug建议诸位先打开Navicat尝试撸一撸,然后再回过头来看看debug提供的实现方式.

为了实现这种功能,我们需要转换下思考的角度:仔细阅读需求,可以得知它是需要我们查找出每种课程类型下课程浏览量前3的课程列表,其实就是找出每个课程在同种课程类型下的浏览量排名,最后再找出每种课程类型下排名前3的课程!

如下图所示为课程信息表,其中,最后一列为debug自己计算出的每个课程在同种课程类型下课程列表中的排名,即top值:

朝着上图这个方向努力了,我们撸出了相应的SQL,如下所示:

SELECT
  a.id,
  a.type_id,
  c.`name` AS typeName,
  a.scan_total,
  a.`name`,
  (
    SELECT
      COUNT(b.id) 
    FROM
      course AS b
    WHERE
      b.type_id = a.type_id
    AND b.scan_total > a.scan_total
  ) AS top
FROM
  course AS a
LEFT JOIN course_type AS c ON c.id = a.type_id
ORDER BY
  a.type_id ASC,
  a.scan_total DESC;

执行上述SQL后得到的结果如下图所示:

(3)到这里我们已经将每种类型下每个课程的排名top计算出来了,需要注意的是,在上图得到的结果中,因为Count(b.id) 得到的值可能为 0 ,因此0代表的就是第 1 名;

可能有些小伙伴还有些疑惑,为什么加个子查询就可以得到上图中的结果呢?其执行过程是怎么样的呢?OK,一图以蔽之,直接看下图相信就可以解答你心中的疑惑了:

(4)最后是直接在外层嵌一个大的查询,然后取排名值 top < 3 的数据列表,即可以得到实现功能需求,其完整的SQL如下所示:

SELECT
  t.*
FROM
  (
    SELECT
      a.id,
      a.type_id,
      c.`name` AS typeName,
      a.scan_total,
      a.`name`,
      (
        SELECT
          COUNT(b.id)
        FROM
          course AS b
        WHERE
          b.type_id = a.type_id
        AND b.scan_total > a.scan_total
      ) AS top
    FROM
      course AS a
    LEFT JOIN course_type AS c ON c.id = a.type_id
    ORDER BY
      a.type_id ASC,
      a.scan_total DESC
  ) AS t
WHERE
  t.top < 3

执行上述SQL后即可以得到相应的结果,如下图所示:

至此,我们已经完成了本文开头提出来的功能需求;那……还有没有其他的实现方式呢?当然有,只不过其实现起来虽然不同,但是其本质思想跟本文开头debug提到的那样“计算出排名top值”是差不多的;

诺,这就是另外的实现方式,从SQL语句就可以看出来,它是上述第一种实现方式的变形:

SELECT
  t.*
FROM
  course AS t
WHERE
  (
    SELECT
      COUNT(*)
    FROM
      course AS c
    WHERE
      c.type_id = t.type_id
    AND c.scan_total > t.scan_total
  ) < 3
ORDER BY
  t.type_id ASC,
  t.scan_total DESC

OK,本文讲解到此介绍,打完收工,咱们下期再见!


总结

代码/数据库下载:本文涉及到的数据库建表语句DDL以及对应的测试数据案例 可私信暗号:1001


我是debug,一个相信技术改变生活、技术成就梦想 的攻城狮;如果本文对你有帮助,请三连哟~

相关推荐

探索Java项目中日志系统最佳实践:从入门到精通

探索Java项目中日志系统最佳实践:从入门到精通在现代软件开发中,日志系统如同一位默默无闻却至关重要的管家,它记录了程序运行中的各种事件,为我们排查问题、监控性能和优化系统提供了宝贵的依据。在Java...

用了这么多年的java日志框架,你真的弄懂了吗?

在项目开发过程中,有一个必不可少的环节就是记录日志,相信只要是个程序员都用过,可是咱们自问下,用了这么多年的日志框架,你确定自己真弄懂了日志框架的来龙去脉嘛?下面笔者就详细聊聊java中常用日志框架的...

物理老师教你学Java语言(中篇)(物理专业学编程)

第四章物质的基本结构——类与对象...

一文搞定!Spring Boot3 定时任务操作全攻略

各位互联网大厂的后端开发小伙伴们,在使用SpringBoot3开发项目时,你是否遇到过定时任务实现的难题呢?比如任务调度时间不准确,代码报错却找不到方向,是不是特别头疼?如今,随着互联网业务规模...

你还不懂java的日志系统吗 ?(java的日志类)

一、背景在java的开发中,使用最多也绕不过去的一个话题就是日志,在程序中除了业务代码外,使用最多的就是打印日志。经常听到的这样一句话就是“打个日志调试下”,没错在日常的开发、调试过程中打印日志是常干...

谈谈枚举的新用法--java(java枚举的作用与好处)

问题的由来前段时间改游戏buff功能,干了一件愚蠢的事情,那就是把枚举和运算集合在一起,然后运行一段时间后buff就出现各种问题,我当时懵逼了!事情是这样的,做过游戏的都知道,buff,需要分类型,且...

你还不懂java的日志系统吗(javaw 日志)

一、背景在java的开发中,使用最多也绕不过去的一个话题就是日志,在程序中除了业务代码外,使用最多的就是打印日志。经常听到的这样一句话就是“打个日志调试下”,没错在日常的开发、调试过程中打印日志是常干...

Java 8之后的那些新特性(三):Java System Logger

去年12月份log4j日志框架的一个漏洞,给Java整个行业造成了非常大的影响。这个事情也顺带把log4j这个日志框架推到了争议的最前线。在Java领域,log4j可能相对比较流行。而在log4j之外...

Java开发中的日志管理:让程序“开口说话”

Java开发中的日志管理:让程序“开口说话”日志是程序员的朋友,也是程序的“嘴巴”。它能让程序在运行过程中“开口说话”,告诉我们它的状态、行为以及遇到的问题。在Java开发中,良好的日志管理不仅能帮助...

吊打面试官(十二)--Java语言中ArrayList类一文全掌握

导读...

OS X 效率启动器 Alfred 详解与使用技巧

问:为什么要在Mac上使用效率启动器类应用?答:在非特殊专业用户的环境下,(每天)用户一般可以在系统中进行上百次操作,可以是点击,也可以是拖拽,但这些只是过程,而我们的真正目的是想获得结果,也就是...

Java中 高级的异常处理(java中异常处理的两种方式)

介绍异常处理是软件开发的一个关键方面,尤其是在Java中,这种语言以其稳健性和平台独立性而闻名。正确的异常处理不仅可以防止应用程序崩溃,还有助于调试并向用户提供有意义的反馈。...

【性能调优】全方位教你定位慢SQL,方法介绍下!

1.使用数据库自带工具...

全面了解mysql锁机制(InnoDB)与问题排查

MySQL/InnoDB的加锁,一直是一个常见的话题。例如,数据库如果有高并发请求,如何保证数据完整性?产生死锁问题如何排查并解决?下面是不同锁等级的区别表级锁:开销小,加锁快;不会出现死锁;锁定粒度...

看懂这篇文章,你就懂了数据库死锁产生的场景和解决方法

一、什么是死锁加锁(Locking)是数据库在并发访问时保证数据一致性和完整性的主要机制。任何事务都需要获得相应对象上的锁才能访问数据,读取数据的事务通常只需要获得读锁(共享锁),修改数据的事务需要获...