2.7. 聚集函数
和大多数其它关系数据库产品一样,PostgreSQL支持聚集函数。 一个聚集函数从多个输入行中计算出一个结果。比如,我们有在一个行集合上计算count
(数目), sum
(总和),avg
(均值),max
(最大值), min
(最小值)的函数。
比如,我们可以用下面的语句找出所有低温中的最高温度:
SELECT max(temp_lo) FROM weather;
max
-----
46
(1 row)
如果我们想知道该读数发生在哪个城市,可能会用:
SELECT city FROM weather WHERE temp_lo = max(temp_lo); _错误_
不过这个方法不能运转,因为聚集函数max
不能用于WHERE
子句中。存在这个限制是因为WHERE
子句决定哪些行可以进入聚集阶段; 因此它必需在聚集函数之前计算。不过,我们可以用其它方法实现这个目的; 这里我们使用子查询:
SELECT city FROM weather
WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
city
---------------
San Francisco
(1 row)
这样做是可以的,因为子查询是一次独立的计算,它独立于外层查询计算自己的聚集。
聚集同样也常用于 GROUP BY
子句。比如,我们可以获取每个城市低温的最高值:
SELECT city, max(temp_lo)
FROM weather
GROUP BY city;
city | max
---------------+-----
Hayward | 37
San Francisco | 46
(2 rows)
这样每个城市一个输出。每个聚集结果都是在匹配该城市的行上面计算的。 我们可以用HAVING
过滤这些分组:
SELECT city, max(temp_lo)
FROM weather
GROUP BY city
HAVING max(temp_lo) < 40;
city | max
---------+-----
Hayward | 37
(1 row)
这样就只给出那些temp_lo
值曾经有低于 40 度的城市。最后, 如果我们只关心那些名字以"S
"开头的城市,我们可以用:
SELECT city, max(temp_lo)
FROM weather
WHERE city LIKE 'S%'<a name="CO.TUTORIAL-AGG-LIKE">**(1)**</a>
GROUP BY city
HAVING max(temp_lo) < 40;
语句中的LIKE
执行模式匹配,在Section 9.7里有解释。
理解聚集和SQL的WHERE
和HAVING
子句之间的关系非常重要。WHERE
和HAVING
的基本区别如下: WHERE
在分组和聚集计算之前选取输入行(它控制哪些行进入聚集计算), 而HAVING
在分组和聚集之后选取输出行。因此,WHERE
子句不能包含聚集函数;因为试图用聚集函数判断那些行将要输入给聚集运算是没有意义的。 相反,HAVING
子句总是包含聚集函数。当然,你可以写不使用聚集的HAVING
子句,但这样做没什么好处,因为同样的条件用在WHERE
阶段会更有效。
在前面的例子里,我们可以在WHERE
里应用城市名称限制,因为它不需要聚集。 这样比在HAVING
里增加限制更加高效,因为我们避免了为那些未通过 WHERE
检查的行进行分组和聚集计算。