SQL 窗口函数与聚合函数的根本差异

发布时间 - 2026-01-25 00:00:00    点击率:
窗口函数不压缩行数而聚合函数会,前者每行输出对应输入行,后者结果行数≤原表;窗口函数支持帧定义、排序敏感计算及NULL精细控制,聚合函数仅依赖分组边界。

窗口函数不会压缩行数,聚合函数会

这是最直观、也最容易被忽略的区别。执行 GROUP BY 后的 SUM()COUNT() 等聚合函数,结果集行数一定 ≤ 原表行数;而 SUM() OVER (...) 这类窗口函数,输出行数严格等于输入行数——每行都带着自己所在窗口的计算结果。

常见错误现象:想在明细报表里加一列「部门销售额占比」,却误用 GROUP BY dept + SUM(sales),结果只剩几行,没法和原始订单行对齐。

  • 聚合函数必须搭配 GROUP BY(或全表无分组),否则报错:ERROR: column "x" must appear in the GROUP BY clause
  • 窗口函数可直接出现在 SELECT 中,不改变原有行结构,也不强制要求 GROUP BY
  • 同一个查询里可以混用:比如 COUNT(*) OVER (PARTITION BY dept) 统计部门人数,同时保留每人姓名、订单号等明细字段

窗口函数支持帧定义(ROWS/RANGE),聚合函数不支持

窗口函数能精确控制“当前行参考哪些邻近行”,比如“过去7天的平均销量”或“从第一行到当前行的累计和”。聚合函数没有这个能力——它只认分组边界,不认顺序或位置。

使用场景:时间序列分析、滚动统计、排名连续性处理(如剔除并列后取 Top 10)。

  • AVG(sales) OVER (ORDER BY order_date ROWS BETWEEN 6 PRECEDING AND CURRENT ROW) 是合法的
  • AVG(sales) GROUP BY dept ORDER BY order_date ROWS BETWEEN ... 语法错误,GROUP BY 后不接受 ROWS 子句
  • RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 对时间字段更安全(自动合并相同值),但可能比 ROWS 慢,尤其数据有重复时间戳时

NULL 值处理逻辑不同

聚合函数默认跳过 NULLCOUNT(*) 除外),这没问题;但窗口函数在帧内遇到 NULL 时,行为更隐蔽——它仍计入帧范围,只是参与计算时被忽略,可能导致“窗口大小看似固定,实际有效行数浮动”。

例如用 ROW_NUMBER() OVER (ORDER BY score DESC) 排名,score IS NULL 的行会被排到最后,但具体位置取决于 NULLS LAST 设置;而 AVG() OVER (...) 遇到 NULL 不报错,但均值分母是去 NULL 后的行数,不是帧声明的行数。

  • COUNT(col)COUNT(col) OVER (...) 都跳过 NULL,但前者返回单值,后者每行都返回同一组内的非空计数
  • 想让窗口函数把 NULL 当 0 参与计算?得显式写 COALESCE(col, 0),不能依赖默认行为
  • NTILE(4) OVER (...) 会把 NULL 分进某一个桶,但顺序由 ORDER BYNULLS FIRST/LAST 决定,容易误判分布

性能开销模式完全不同

聚合函数通常触发一次哈希/排序分组,整体代价相对可控;窗口函数若带 ORDER BY 和大范围帧(如 UNBOUNDED PRECEDING),可能引发多次扫描或内存缓冲膨胀,尤其在未建索引的排序字段上。

容易踩的坑:在千万级订单表上直接跑 SUM(amount) OVER (ORDER BY create_time),没索引时 PG 可能爆内存,MySQL 8.0 则可能退化为 N² 复杂度。

  • 优先给 OVER 子句中的 ORDER BY 字段建索引,特别是和 PARTITION BY 组合时(如 PARTITION BY user_id ORDER BY ts
  • 避免在子查询或视图里嵌套多层窗口函数,优化器未必能剪枝,中间结果集可能远超预期
  • LAG()/LEAD() 看似轻量,但如果 OFFSE

    T
    很大(如 LAG(x, 1000))且无索引,性能下降明显
实际写 SQL 时,先问自己一句:这列结果要不要跟原始每一行对齐?要,就选窗口函数;只要汇总值,就用聚合函数。两者混用不难,难的是意识到它们根本不在同一抽象层级上。


# mysql  # app  # 区别  # 聚合函数  # sql  # NULL  # count  # select  # Error  # column  # 行数  # 报错  # 里加  # 跳过  # 的是  # 这是  # 也不  # 子句  # 带着  # 一句 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel路由怎么定义_Laravel核心路由系统完全入门指南  Laravel API资源(Resource)怎么用_格式化Laravel API响应的最佳实践  php 三元运算符实例详细介绍  Laravel如何创建和注册中间件_Laravel中间件编写与应用流程  UC浏览器如何切换小说阅读源_UC浏览器阅读源切换【方法】  Win11搜索栏无法输入_解决Win11开始菜单搜索没反应问题【技巧】  Laravel如何配置任务调度?(Cron Job示例)  Laravel怎么使用Blade模板引擎_Laravel模板继承与Component组件复用【手册】  深圳网站制作设计招聘,关于服装设计的流行趋势,哪里的资料比较全面?  利用JavaScript实现拖拽改变元素大小  如何快速搭建支持数据库操作的智能建站平台?  ChatGPT怎么生成Excel公式_ChatGPT公式生成方法【指南】  千问怎样用提示词获取健康建议_千问健康类提示词注意事项【指南】  清除minerd进程的简单方法  谷歌Google入口永久地址_Google搜索引擎官网首页永久入口  LinuxCD持续部署教程_自动发布与回滚机制  Python函数文档自动校验_规范解析【教程】  JavaScript常见的五种数组去重的方式  Linux虚拟化技术教程_KVMQEMU虚拟机安装与调优  Laravel怎么使用Collection集合方法_Laravel数组操作高级函数pluck与map【手册】  详解Nginx + Tomcat 反向代理 负载均衡 集群 部署指南  如何基于PHP生成高效IDC网络公司建站源码?  Laravel如何实现多表关联模型定义_Laravel多对多关系及中间表数据存取【方法】  网站制作软件有哪些,制图软件有哪些?  Laravel怎么做数据加密_Laravel内置Crypt门面的加密与解密功能  千库网官网入口推荐 千库网设计创意平台入口  php json中文编码为null的解决办法  Laravel如何正确地在控制器和模型之间分配逻辑_Laravel代码职责分离与架构建议  Win11怎么关闭资讯和兴趣_Windows11任务栏设置隐藏小组件  详解Nginx + Tomcat 反向代理 如何在高效的在一台服务器部署多个站点  如何在服务器上配置二级域名建站?  Firefox Developer Edition开发者版本入口  Laravel如何使用Passport实现OAuth2?(完整配置步骤)  Win11关机界面怎么改_Win11自定义关机画面设置【工具】  html5audio标签播放结束怎么触发事件_onended回调方法【教程】  EditPlus中的正则表达式实战(6)  如何在万网ECS上快速搭建专属网站?  HTML5打空格有哪些误区_新手常犯的空格使用错误【技巧】  教你用AI将一段旋律扩展成一首完整的曲子  Laravel如何使用Service Provider注册服务_Laravel服务提供者配置与加载  Laravel Fortify是什么,和Jetstream有什么关系  Laravel如何实现全文搜索_Laravel Scout集成Algolia或Meilisearch教程  如何彻底卸载建站之星软件?  详解Android——蓝牙技术 带你实现终端间数据传输  广州网站制作公司哪家好一点,广州欧莱雅百库网络科技有限公司官网?  公司网站制作价格怎么算,公司办个官网需要多少钱?  Laravel Admin后台管理框架推荐_Laravel快速开发后台工具  如何在IIS中新建站点并配置端口与IP地址?  大连网站制作公司哪家好一点,大连买房网站哪个好?  三星网站视频制作教程下载,三星w23网页如何全屏?