2.5. 查询一个表
要从一个表中检索数据就是查询这个表。SQL 的SELECT
语句就是做这个用途的。该语句分为选择列表(列出要返回的字 段)、表列表(列出从中检索数据的表)、以及可选的条件(声明任意限制)。比如,要检索表 weather
的所有行,键入:
SELECT * FROM weather;
这里的*
是"所有字段"的缩写。 [1] 因此同样的结果可以用下面的语句获得:
SELECT city, temp_lo, temp_hi, prcp, date FROM weather;
而输出应该是:
city | temp_lo | temp_hi | prcp | date
---------------+---------+---------+------+------------
San Francisco | 46 | 50 | 0.25 | 1994-11-27
San Francisco | 43 | 57 | 0 | 1994-11-29
Hayward | 37 | 54 | | 1994-11-29
(3 rows)
你可以在选择列表中写任意表达式,而不仅仅是字段列表。比如,你可以:
SELECT city, (temp_hi+temp_lo)/2 AS temp_avg, date FROM weather;
这样应该得到:
city | temp_avg | date
---------------+----------+------------
San Francisco | 48 | 1994-11-27
San Francisco | 50 | 1994-11-29
Hayward | 45 | 1994-11-29
(3 rows)
请注意这里的AS
子句是如何给输出字段重新命名的。AS
子句是可选的。
一个查询可以使用WHERE
子句进行"修饰",声明需要哪些行。 WHERE
子句包含一个布尔表达式(值为真),只有那些布尔表达式为 真的行才会被返回。允许你在条件中使用常用的布尔操作符(AND
, OR
,NOT
)。比如,下面的查询检索旧金山的下 雨天的天气:
SELECT * FROM weather
WHERE city = 'San Francisco' AND prcp > 0.0;
结果:
city | temp_lo | temp_hi | prcp | date
---------------+---------+---------+------+------------
San Francisco | 46 | 50 | 0.25 | 1994-11-27
(1 row)
你可以要求返回的查询是排好序的:
SELECT * FROM weather
ORDER BY city;
city | temp_lo | temp_hi | prcp | date
---------------+---------+---------+------+------------
Hayward | 37 | 54 | | 1994-11-29
San Francisco | 43 | 57 | 0 | 1994-11-29
San Francisco | 46 | 50 | 0.25 | 1994-11-27
在这个例子里,排序的顺序并非绝对清晰的,因此你可能看到 San Francisco 行 随机的排序。但是如果你使用下面的语句,那么就总是会得到上面的结果:
SELECT * FROM weather
ORDER BY city, temp_lo;
你可以要求查询的结果消除重复行的输出:
SELECT DISTINCT city
FROM weather;
city
---------------
Hayward
San Francisco
(2 rows)
再次声明,结果行的顺序可能是随机的。你可以组合使用DISTINCT
和ORDER BY
来获取一致的结果: [2]
SELECT DISTINCT city
FROM weather
ORDER BY city;
Notes
[1] 虽然SELECT *
对于即兴的查询是有用的,但我们普遍认为在生产代码中 这是很糟糕的风格,因为给表增加一个字段就改变了结果。
[2] 在一些数据库系统里,包括老版本的PostgreSQL, DISTINCT
自动对行进行排序,因此ORDER BY
是多余的。但是这一点并不是 SQL 标准的要求,并且目前的PostgreSQL 并不保证DISTINCT
导致数据行被排序。