SELECT
Name
SELECT, TABLE, WITH -- 从表或视图中取出若干行
Synopsis
[ WITH [ RECURSIVE ] _with_query_ [, ...] ]
SELECT [ ALL | DISTINCT [ ON ( _expression_ [, ...] ) ] ]
* | _expression_ [ [ AS ] _output_name_ ] [, ...]
[ FROM _from_item_ [, ...] ]
[ WHERE _condition_ ]
[ GROUP BY _expression_ [, ...] ]
[ HAVING _condition_ [, ...] ]
[ WINDOW _window_name_ AS ( _window_definition_ ) [, ...] ]
[ { UNION | INTERSECT | EXCEPT } [ ALL | DISTINCT ] _select_ ]
[ ORDER BY _expression_ [ ASC | DESC | USING _operator_ ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ LIMIT { _count_ | ALL } ]
[ OFFSET _start_ [ ROW | ROWS ] ]
[ FETCH { FIRST | NEXT } [ _count_ ] { ROW | ROWS } ONLY ]
[ FOR { UPDATE | NO KEY UPDATE | SHARE | KEY SHARE } [ OF _table_name_ [, ...] ] [ NOWAIT ] [...] ]
这里的`_from_item_` 可以是:
[ ONLY ] _table_name_ [ * ] [ [ AS ] _alias_ [ ( _column_alias_ [, ...] ) ] ]
[ LATERAL ] ( _select_ ) [ AS ] _alias_ [ ( _column_alias_ [, ...] ) ]
_with_query_name_ [ [ AS ] _alias_ [ ( _column_alias_ [, ...] ) ] ]
[ LATERAL ] _function_name_ ( [ _argument_ [, ...] ] ) [ AS ] _alias_ [ ( _column_alias_ [, ...] | _column_definition_ [, ...] ) ]
[ LATERAL ] _function_name_ ( [ _argument_ [, ...] ] ) AS ( _column_definition_ [, ...] )
_from_item_ [ NATURAL ] _join_type_ _from_item_ [ ON _join_condition_ | USING ( _join_column_ [, ...] ) ]
`_with_query_`是:
_with_query_name_ [ ( _column_name_ [, ...] ) ] AS ( _select_ | _values_ | _insert_ | _update_ | _delete_ )
TABLE [ ONLY ] _table_name_ [ * ]
描述
SELECT
将从零个或更多表中返回记录行。SELECT
通常的处理如下:
计算列出在
WITH
中的所有查询。这些有效的充当可以在FROM
列表中引用的临时表。一个在FROM
中多次引用的WITH
查询只计算一次。(参阅下面的 WITH 子句。)计算列出在
FROM
中的所有元素(FROM
列表中的每个元素都是一个实际的或虚拟的表)。如果在FROM
列表里声明了多个元素,那么他们就交叉连接在一起(参见下面的 FROM 子句)。如果声明了
WHERE
子句,那么在输出中消除所有不满足条件的行。 (参见下面的WHERE 子句。)如果声明了
GROUP BY
子句,输出就组合成匹配一个或多个数值的不同组里。 如果出现了HAVING
子句,那么它消除那些不满足给出条件的组。 (参见下面的GROUP BY 子句 和 HAVING 子句。)实际输出行将使用
SELECT
输出表达式针对每一个选中的行或行组进行计算。 (参见下面的SELECT 列表。)SELECT DISTINCT
从结果中消除重复的行。SELECT DISTINCT ON
消除匹配所有指定表达式的行。SELECT ALL
(缺省)返回所有的行, 包括重复的行。(参阅下面的DISTINCT 子句。)使用
UNION
,INTERSECT
,EXCEPT
可以把多个SELECT
语句的输出合并成一个结果集。UNION
操作符返回两个结果集的并集。INTERSECT
操作符返回两个结果集的交集。EXCEPT
操作符返回在第一个结果集对第二个结果集的差集。不管哪种情况, 重复的行都被删除,除非声明了ALL
。噪声字DISTINCT
可以用来明确的声明消除重复的行。请注意,DISTINCT
在这里是缺省的行为, 即使ALL
是SELECT
本身的缺省。 (参阅下面的UNION 子句、INTERSECT 子句、 EXCEPT 子句。)如果声明了
ORDER BY
子句,那么返回的行将按照指定的顺序排序。 如果没有给出ORDER BY
,那么数据行是按照系统认为可以最快生成的顺序给出的。 (参阅下面的ORDER BY 子句。)如果给出了
LIMIT
(或FETCH FIRST
)或OFFSET
子句,那么SELECT
语句只返回结果行的一个子集。 (参阅下面的LIMIT 子句。)如果声明了
FOR UPDATE
,FOR NO KEY UPDATE
,FOR SHARE
或FOR KEY SHARE
子句,那么SELECT
语句对并发的更新锁住选定的行。 (参阅下面的锁定子句子句。)
你必须对每个在SELECT
命令中使用的字段有SELECT
权限。 使用FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
或FOR KEY SHARE
还要求UPDATE
权限 (至少选择每个表的一列)。
参数
WITH
子句
WITH
子句允许声明一个或多个可以在主查询中通过名字引用的子查询。 子查询在主查询期间有效的充当临时表或视图。每个子查询可以是SELECT
, VALUES
, INSERT
, UPDATE
或 DELETE
语句。当在WITH
中写一个数据修改语句时 (INSERT
, UPDATE
或 DELETE
), 通常包含一个RETURNING
子句。RETURNING
的输出而不是 语句修改的底层表的输出形成被主查询读取的临时表。如果省略了RETURNING
, 该语句仍然执行,但是不会产生输出,所以不能作为一个表被主查询引用。
必须为每个WITH
查询声明一个名字(没有模式修饰)。 可选的,可以指定字段名的列表;如果省略了,那么字段名从子查询中推断出。
如果声明了RECURSIVE
,那么允许SELECT
子查询通过名字引用它自己。 比如一个有下面形式的子查询
_non_recursive_term_ UNION [ ALL | DISTINCT ] _recursive_term_
递归的自我引用必须在UNION
的右边出现。每个查询只允许一个递归的自我引用。 不支持递归的数据修改语句,但是可以在数据修改语句中使用递归的SELECT
查询的结果。参阅Section 7.8获取一个例子。
RECURSIVE
的另外一个作用是WITH
查询不需要排序: 一个查询可以引用另外一个稍后出现在列表中的查询。(但是,循环引用或相互递归没有实现。) 没有RECURSIVE
,WITH
查询只能引用 更早出现在WITH
列表中的同层级的WITH
查询。
WITH
查询的主要特性是他们只在主查询的每次执行中评估一次, 即使主查询引用了他们多次也是如此。特别的,保证数据修改语句只被执行一次, 不管主查询读取他们的所有或任意的输出。
主查询和WITH
查询(理论上)同时执行。这意味着WITH
中的数据修改语句的影响不能从查询的其他部分看到,除非读取它的RETURNING
输出。如果两个这样的数据修改语句尝试修改相同的行,那么结果是未知的。
参阅Section 7.8获取额外的信息。
FROM
子句
FROM
子句为SELECT
声明一个或者多个源表。如果声明了多个源表, 那么结果就是所有源表的笛卡儿积(交叉连接)。但是通常会添加一些条件(通过WHERE
), 把返回行限制成笛卡儿积的一个小的子集。
FROM
子句可以包括下列元素:
_table_name_
一个现存的表或视图的名字(可以有模式修饰)。如果声明了ONLY
,则只扫描该表; 否则,该表和所有其派生表(如果有的话)都被扫描。可以在表名后面跟一个*
表示扫描所有其后代表。
_alias_
为那些包含别名的FROM
项目取的别名。别名用于缩写或者在自连接中消除歧义 (自连接中同一个表将扫描多次)。如果提供了别名,那么它就会完全隐藏表或者函数的实际名字; 比如,如果给出FROM foo AS f
,那么SELECT
剩下的东西必须把这个FROM
项按照f
而不是foo
引用。 如果写了别名,也可以提供一个字段别名列表,这样可以替换表中一个或者多个字段的名字。
_select_
可以在FROM
子句里出现一个子SELECT
。 它的输出作用好像是为这条SELECT
命令在其生存期里创建一个临时表。 请注意这个子SELECT
必须用园括弧包围。并且必须给它一个别名。 当然,VALUES同样也可以在这里使用。
_with_query_name_
WITH
查询通过写它自己的名字来引用,就像查询的名字就是一个表的名字。 (实际上,WITH
查询为主查询隐藏了相同名字的任意实际表。 如果需要,可以通过模式限定表的名字来引用相同名字的实际表。)别名可以用相同的方式提供给表。
_function_name_
函数(特别是那些返回结果集的函数)调用可以出现在FROM
子句里。 这么做就好像在这个SELECT
命令的生命期中,把函数的输出创建为一个临时表一样。 当然也可以使用别名。如果写了别名,还可以写一个字段别名列表, 为函数返回的复合类型的一个或多个属性提供名字替换。如果函数定义为返回record
类型, 那么必须出现一个AS
关键字或者别名,后面跟着一个形如 (
_column_name_
_data_type_
[, ... ] )的字段定义列表。这个字段定义列表必须匹配函数返回的字段的实际数目和类型。
_join_type_
下列之一:
[ INNER ] JOIN
LEFT [ OUTER ] JOIN
RIGHT [ OUTER ] JOIN
FULL [ OUTER ] JOIN
CROSS JOIN
必须为INNER
和OUTER
连接类型声明一个连接条件, 也就是NATURAL
, ON
_join_condition_
, or USING (``_join_column_
[, ...]) 之一。 它们的含义见下文,对于CROSS JOIN
而言,这些子句都不能出现。
一个JOIN
子句组合两个FROM
项,为了方便我们将其作为"tables" 引用,尽管实际上他们可以是任意FROM
条目的类型。必要时使用圆括弧以决定嵌套的顺序。 如果没有圆括弧,JOIN
从左向右嵌套。在任何情况下,JOIN
都比逗号分隔的FROM
列表绑定得更紧。
CROSS JOIN
和INNER JOIN
生成一个简单的笛卡儿积, 和你在FROM
的顶层列出两个表的结果相同,但是受到连接条件(如果有)的限制。 CROSS JOIN
等效于INNER JOIN ON (TRUE)
,也就是说, 没有被条件删除的行。这种连接类型只是符号上的方便,因为它们和你用简单的 FROM
和WHERE
的效果一样。
LEFT OUTER JOIN
返回笛卡儿积中所有符合连接条件的行, 再加上左表中通过连接条件没有匹配右表行的那些行。这样,左边的行将扩展成生成表的全长, 方法是在那些右表对应的字段位置填上 NULL 。请注意,只在计算匹配的时候, 才使用JOIN
子句的条件,外层的条件是在计算完毕之后施加的。
相应的,RIGHT OUTER JOIN
返回所有内连接的结果行, 加上每个不匹配的右边行(左边用 NULL 扩展)。这只是一个符号上的便利, 因为总是可以把它转换成一个LEFT OUTER JOIN
,只要把左边和右边的输入对掉一下即可。
FULL OUTER JOIN
返回所有内连接的结果行,加上每个不匹配的左边行(右边用 NULL 扩展), 再加上每个不匹配的右边行(左边用 NULL 扩展)。
ON
_join_condition_
一个生成boolean
类型结果的表达式(类似WHERE
子句), 限定连接中那些行是匹配的。
USING (
_join_column_
[, ...] )
一个形如USING ( a, b, ... )
的子句,是ON left_table.a = right_table.a AND left_table.b = right_table.b ...
的缩写。 同样,USING
蕴涵着每对等效字段中只有一个包含在连接输出中,而不是两个都输出的意思。
NATURAL
NATURAL
是一个USING
列表的缩写,这个列表说的是两个表中同名的字段。
LATERAL
LATERAL
关键字可以放在一个子SELECT
FROM
项目的前面。 这允许子SELECT
引用出现在FROM
列表之前的FROM
条目中的字段。 (没有LATERAL
,每个子SELECT
独立评估并且以此不能交叉引用任何其他 FROM
条目。)
LATERAL
也可以放在一个函数调用FROM
条目的前面, 但是这种情况下它是一个噪声字,因为函数表达式可以在任何情况下引用前面的FROM
条目。
LATERAL
可以出现在FROM
列表的顶层,或出现在JOIN
树中。 在后面当前情况下,它也可以引用JOIN
左侧和右侧的任意条目。
当FROM
条目包含LATERAL
交叉引用时,评估收益如下: 对于提供交叉引用字段的FROM
条目的每一行,或提供字段的多个FROM
条目的行集,使用该字段的行或行集值评估LATERAL
条目。 结果行像往常一样和计算他们的行连接。这是从字段源表重复每行或行集。
字段源表必须INNER
或LEFT
连接LATERAL
条目, 其他为LATERAL
条目计算每个行集的行集将不会是明确定义的行集。 因此,尽管一个构造(如_X_
RIGHT JOIN LATERAL _Y_
) 在语法结构上合法,并不实际上允许_Y_
引用_X_
。
WHERE
子句
可选的WHERE
条件有如下常见的形式:
WHERE _condition_
这里_condition_
可以是任意生成类型为 boolean
的表达式。任何不满足这个条件的行都会从输出中删除。 如果一个行的数值代入到条件中计算出来的结果为真,那么该行就算满足条件。
GROUP BY
子句
可选的GROUP BY
子句的一般形式
GROUP BY _expression_ [, ...]
它将把所有在组合表达式上拥有相同值的行压缩成一行。 _expression_
可以是一个输入字段名字, 或者是一个输出字段(SELECT
列表项)的名字或序号, 或者也可以是任意输入字段组成的表达式。在有歧义的情况下, 一个GROUP BY
的名字将被解释成输入字段的名字,而不是输出字段的名字。
如果使用了聚集函数,那么就会对每组中的所有行进行计算并生成一个单独的值 (而如果没有GROUP BY
,那么聚集将对选出来的所有行计算出一个单独的值)。 如果出现了GROUP BY
,那么SELECT
列表表达式中再引用那些没有分组的字段就是非法的,除非放在聚集函数里, 或未分组的字段函数上依赖于分组的字段,因为对于未分组的字段,可能会返回多个数值。 如果分组的字段(或它们的一个子集)是包含未分组字段的表的主键,那么存在一个函数依赖。
HAVING
子句
可选的HAVING
子句有如下形式:
HAVING _condition_
这里_condition_
与为 WHERE
子句里声明的相同。
HAVING
去除了一些不满足条件的组行。它与WHERE
不同:WHERE
在使用GROUP BY
之前过滤出单独的行, 而HAVING
过滤由GROUP BY
创建的行。 在_condition_
里引用的每个字段都必须无歧义地引用一个分组的行,除非引用出现在一个聚集函数里。
HAVING
的出现把查询变成一个分组的查询,即使没有GROUP BY
子句也这样。这一点和那些包含聚集函数但没有GROUP BY
子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而SELECT
列表和HAVING
子句只能从聚集函数里面引用表的字段。 这样的查询在HAVING
条件为真的时候将发出一个行,如果为非真,则返回零行。
WINDOW
子句
WINDOW
子句的一般形式是
WINDOW _window_name_ AS ( _window_definition_ ) [, ...]
这里的_window_name_
是可以在OVER
子句中引用的名字或随后的窗口定义,这里的_window_definition_
是
[ _existing_window_name_ ]
[ PARTITION BY _expression_ [, ...] ]
[ ORDER BY _expression_ [ ASC | DESC | USING _operator_ ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ _frame_clause_ ]
如果声明了_existing_window_name_
, 那么必须引用一个在WINDOW
列表中出现的更早的项;新的窗口从这个项中拷贝分区子句, 和排序子句(如果有)。在这种情况下,这个新的窗口不能声明他自己的PARTITION BY
子句, 但是如果拷贝的窗口没有排序子句的话他可以声明ORDER BY
子句。 新窗口总是使用他自己的框架子句;拷贝的窗口必须不能声明框架子句。
PARTITION BY
列表的元素的以与GROUP BY 子句 的元素相同的方式来解释,除了他们总是简单的表达式并且从不是一个输出列的名称或者编号。 另外一个差异是这些表达式可以包含聚集函数调用,而在常规的GROUP BY
子句中这是不允许的。 在这里允许是因为开窗在分组和聚集之后发生。
同样的,ORDER BY
列表的元素以与ORDER BY 子句 的元素相同的方式来解释,除了这个表达式总是作为简单的表达式并且从不是一个输出列的名称或者编号。
可选的_frame_clause_
为依赖于框架的窗口函数(不是所有)定义 窗口框架。窗口框架是查询中的每行(称为当前行)的一组相关行。 _frame_clause_
可以是下列之一
[ RANGE | ROWS ] _frame_start_
[ RANGE | ROWS ] BETWEEN _frame_start_ AND _frame_end_
这里的_frame_start_
和_frame_end_
可以是下列之一
UNBOUNDED PRECEDING
_value_ PRECEDING
CURRENT ROW
_value_ FOLLOWING
UNBOUNDED FOLLOWING
如果省略了_frame_end_
,那么它的缺省是CURRENT ROW
。 限制是_frame_start_
不能是UNBOUNDED FOLLOWING
, _frame_end_
不能是UNBOUNDED PRECEDING
, _frame_end_
选项在上面的列表中不能比_frame_start_
选项出现的早,例如RANGE BETWEEN CURRENT ROW AND
_value_
PRECEDING是不允许的。
缺省框架选项是RANGE UNBOUNDED PRECEDING
,这与RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
相同;它将框架设置为分区中的所有行,在ORDER BY
序列中是从当前行的最后一个元素开始(这意味着若无ORDER BY
则是所有行)。 通常,UNBOUNDED PRECEDING
表示框架从分区的第一行开始,类似的 UNBOUNDED FOLLOWING
表示框架以分区的最后一行结束(不管是RANGE
还是ROWS
模式)。在ROWS
模式,CURRENT ROW
意味着框架以当前行开始或结束;但是在RANGE
模式,意味着框架以当前行在 ORDER BY
序列中的第一个或最后一个元素开始或结束。_value_
PRECEDING
和_value_
FOLLOWING
子句目前只允许在ROWS
模式。 他们表明框架以当前行之前或者之后许多行开始或者结束。_value_
必须是一个不包含任何变量、聚集函数或者窗口函数的整型表达式。该值不能为空或者负值; 但可以为0,并且这时选择当前行本身。
注意如果ORDER BY
排序不能唯一地排列行,那么ROWS
选项可能产生不可预测的结果。RANGE
选项是为了确保ORDER BY
序列中的对等的行能得到同等对待;任何两个对等行将会都在或者都不在框架中。
一个WINDOW
语句的目的是指定出现在查询的SELECT 列表 或者ORDER BY 子句中的window 函数的行为。 这些函数可以在其OVER
子句中通过名称引用WINDOW
子句条目。 一个WINDOW
子句条目不需要在任何地方都引用;若它不在查询中使用,它将被忽略。 可以使用窗口程序而根本不需要任何WINDOW
子句, 因为一个窗口函数调用可以直接在其OVER
子句中指定其窗口定义。然而, WINDOW
子句会在多个窗口函数需要相同窗口定义时保存输入。
窗口函数在Section 3.5, Section 4.2.8, 和 Section 7.2.4中有详细描述。
SELECT
列表
SELECT
列表(在SELECT
和FROM
关键字之间的部分) 声明组成SELECT
语句的输出行的表达式。这些表达式可以 (并且通常也会)引用在FROM
子句里面计算出来的字段。
就像在一个表中,一个SELECT
的每个输出列都有一个名称。 在一个简单的SELECT
中,该名称仅用于标记显示的列, 但当SELECT
是一个较大查询的子查询时,名称被较大查询视为子查询产生的虚表的字段名。 为了指定用于输出列的名称,要在列表达式后写AS
_output_name_
。(您可以省略AS
, 但只有当所需的输出名称不匹配任何PostgreSQL关键字时 (请参阅Appendix C)。为了防止将来可能的关键字添加, 建议您要么写AS
要么用双引号引起输出名称。)如果你不指定一个字段名, PostgreSQL会自动选择一个名称。如果字段的表达式是一个简单的列引用, 那么选择的名称与字段名相同;在更复杂的情况下,可能会使用一个函数或类型名, 或系统会依赖于一个类似?column?
的生成名。
一个输出列的名称可以用来参考ORDER BY
和GROUP BY
子句中的字段的值, 而不是在WHERE
或者HAVING
子句中的;反而您必须在那里写出表达式。
除了表达式,也可以在输出列表中使用*
表示所有字段。 还可以用_table_name_
.* 作为来自该表的所有字段的缩写。这些情况下用AS
指定新名称是不可能的; 输出列的名称将会与表列的名称相同。
DISTINCT
子句
如果声明了SELECT DISTINCT
,那么就从结果集中删除所有重复的行 (每个有重复的组都保留一行)。SELECT ALL
声明相反的作用:所有行都被保留(这是缺省)。
SELECT DISTINCT ON (
_expression_
[, ...] ) 只保留那些在给出的表达式上运算出相同结果的行集合中的第一行。DISTINCT ON
表达式是使用与ORDER BY
相同的规则进行解释的(见上文)。请注意, 除非使用了ORDER BY
来保证需要的行首先出现,否则,"第一行" 是不可预测的。比如:
SELECT DISTINCT ON (location) location, time, report
FROM weather_reports
ORDER BY location, time DESC;
为每个地点检索最近的天气报告。但是如果没有使用ORDER BY
来强制对每个地点的时间值进行降序排序,那么就会得到每个地点的不知道什么时候的报告。
DISTINCT ON
表达式必须匹配最左边的ORDER BY
表达式。 ORDER BY
子句将通常包含额外的表达式来判断每个DISTINCT ON
组里面需要的行的优先级。
UNION
子句
UNION
子句的一般形式是:
_select_statement_ UNION [ ALL | DISTINCT ] _select_statement_
这里的_select_statement_
是任意没有 ORDER BY
, LIMIT
, FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
, 或 FOR KEY SHARE
子句的SELECT
语句。 如果用圆括弧包围,ORDER BY
和LIMIT
可以附着在子表达式里。 如果没有圆括弧,这些子句将交给UNION
的结果使用,而不是给它们右边的输入表达式。
UNION
操作符计算那些涉及到的所有SELECT
语句返回的行的结果联合。一个行如果至少在两个结果集中的一个里面出现, 那么它就会在这两个结果集的集合联合中。两个作为UNION
直接操作数的SELECT
必须生成相同数目的字段, 并且对应的字段必须有兼容的数据类型。
缺省的UNION
结果不包含任何重复的行,除非声明了ALL
选项。 ALL
制止了消除重复的动作。因此,UNION ALL
通常比 UNION
明显要快,可能的情况下尽量使用ALL
。 DISTINCT
可以明确的指定消除重复行的缺省行为。
同一个SELECT
语句中的多个UNION
操作符是从左向右计算的, 除非用圆括弧进行了标识。
目前,FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
和 FOR KEY SHARE
不能在UNION
的结果或输入中声明。
INTERSECT
子句
INTERSECT
子句的一般形式是:
_select_statement_ INTERSECT [ ALL | DISTINCT ] _select_statement_
_select_statement_
是任何不带 ORDER BY
, LIMIT
, FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
, 或 FOR KEY SHARE
子句的SELECT
语句。
INTERSECT
计算涉及的SELECT
语句返回的行集合的交集。 如果一个行在两个结果集中都出现,那么它就在两个结果集的交集中。
INTERSECT
的结果不包含任何重复行,除非你声明了ALL
选项。 用了ALL
以后,一个在左边的表里有_m_
个重复而在右边表里有 _n_
个重复的行将在结果集中出现min(_m_
,_n_
)次。 DISTINCT
可以明确的指定消除重复行的缺省行为。
除非用圆括号指明顺序,同一个SELECT
语句中的多个 INTERSECT
操作符是从左向右计算的。INTERSECT
比UNION
绑定得更紧,也就是说A UNION B INTERSECT C
将理解成 A UNION (B INTERSECT C)
。
目前,不能给INTERSECT
的结果或者任何INTERSECT
的输入声明 FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
和 FOR KEY SHARE
。
EXCEPT
子句
EXCEPT
子句有如下的通用形式:
_select_statement_ EXCEPT [ ALL | DISTINCT ] _select_statement_
_select_statement_
是任何没有 ORDER BY
, LIMIT
, FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
, 或 FOR KEY SHARE
子句的SELECT
表达式。
EXCEPT
操作符计算存在于左边SELECT
语句的输出而不存在于右边SELECT
语句输出的行。
EXCEPT
的结果不包含任何重复的行,除非声明了ALL
选项。 使用ALL
时,一个在左边表中有_m_
个重复而在右边表中有 _n_
个重复的行将在结果中出现max(_m_
-_n_
,0)次。 DISTINCT
可以明确的指定消除重复行的缺省行为。
除非用圆括弧指明顺序,否则同一个SELECT
语句中的多个 EXCEPT
操作符是从左向右计算的。EXCEPT
和UNION
的绑定级别相同。
目前,不能给EXCEPT
的结果或者任何EXCEPT
的输入声明 FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
和 FOR KEY SHARE
子句。
ORDER BY
子句
可选的ORDER BY
子句有下面的一般形式:
ORDER BY _expression_ [ ASC | DESC | USING _operator_ ] [ NULLS { FIRST | LAST } ] [, ...]
ORDER BY
子句导致结果行根据指定的表达式进行排序。 如果根据最左边的表达式,两行的结果相同,那么就根据下一个表达式进行比较, 依此类推。如果对于所有声明的表达式他们都相同,那么按随机顺序返回。
每个_expression_
可以是一个输出字段 (SELECT
列表项)的名字或者序号,或者也可以是用输入字段的数值组成的任意表达式。
序数指的是输出字段按顺序(从左到右)的位置。这个特性可以对没有唯一名称的字段进行排序。 这不是必须的,因为总是可以通过AS
子句给一个要输出的字段赋予一个名称。
在ORDER BY
里还可以使用任意表达式,包括那些没有出现在 SELECT
输出列表里面的字段。因此下面的语句现在是合法的:
SELECT name FROM distributors ORDER BY code;
这个特性的一个局限就是应用于UNION
,INTERSECT
,EXCEPT
子句的结果的ORDER BY
子句只能在一个输出字段名或者数字上声明, 而不能在一个表达式上声明。
如果一个ORDER BY
表达式是一个简单名称,同时匹配结果字段和输入字段, ORDER BY
将把它解释成结果字段名称。这和GROUP BY
在同样情况下做的选择正相反。这样的不一致是用来和 SQL 标准兼容的。
可以给ORDER BY
子句里每个字段加一个可选的ASC
(升序,缺省) 或DESC
(降序)关键字。还可以在USING
子句里声明一个排序操作符来实现排序。排序操作符必须小于或大于某些B-tree操作符族的成员。 ASC
等效于使用USING <
而DESC
等效于使用USING >
。 但是一个用户定义类型的创建者可以明确定义缺省的排序顺序,并且可以使用其他名称的操作符。
如果指定NULLS LAST
,空值会在所有非空值之后排序;如果指定 NULLS FIRST
,空值会在所有非空值之前排序。如果两者均未指定, 当指定ASC
或缺省时,默认反应时是NULLS LAST
, 并且当指定DESC
时,默认反应时是NULLS FIRST
(因此, 默认地认为空是大于非空的)。当指定USING
时, 默认空排序依赖于操作符是小于还是大于操作符。
请注意排序选项仅适用于他们遵循的表达式;例如ORDER BY x, y DESC
不意味着与ORDER BY x DESC, y DESC
相同。
字符类型的数据是按照应用于被排序的字段的排序规则排序的。可以在需要时通过在 _expression_
中包含COLLATE
子句覆盖,例如ORDER BY mycolumn COLLATE "en_US"
。更多信息请参阅 Section 4.2.10和Section 22.2。
LIMIT
子句
LIMIT
子句由两个独立的子句组成:
LIMIT { _count_ | ALL }
OFFSET _start_
_count_
声明返回的最大行数, 而_start_
声明开始返回行之前忽略的行数。 如果两个都指定了,那么在开始计算_count_
个返回行之前将先跳过_start_
行。
如果_count_
表达式评估为NULL, 它被当做LIMIT ALL
,也就是,没有限制。如果 _start_
评估为NULL,他与 OFFSET 0
相同对待。
SQL:2008引入了一个不同的语法来达到相同的效果,这也是PostgreSQL支持的。这是:
OFFSET _start_ { ROW | ROWS }
FETCH { FIRST | NEXT } [ _count_ ] { ROW | ROWS } ONLY
在该语法中,为_start_
或_count_
提供除简单整型常量之外的东西时,你必须写圆括号。如果_count_
在FETCH
子句中省略了,它默认为1。ROW
和ROWS
以及FIRST
和NEXT
是不影响这些子句的效果的干扰词。 根据该标准,若两个都存在则OFFSET
子句必须在FETCH
子句之前出现; 但是PostgreSQL的要求更为宽松并且允许任意一种顺序。
使用LIMIT
的一个好习惯是使用一个ORDER BY
子句把结果行限制成一个唯一的顺序。 否则你会得到无法预料的结果子集,你可能想要第十行到第二十行,但是是以什么顺序的第十行到第二十行? 除非你声明ORDER BY
,否则你不知道什么顺序。
查询优化器在生成查询规划时会把LIMIT
考虑进去,所以你很有可能因给出的 LIMIT
和OFFSET
值不同而得到不同的规划(生成不同的行序)。 因此用不同的LIMIT
/OFFSET
值选择不同的查询结果的子集 将不会产生一致的结果,除非你用ORDER BY
强制生成一个可预计的结果顺序。这可不是 bug ;这是 SQL 生来的特点, 因为除非用了ORDER BY
约束顺序,SQL 不保证查询生成的结果有任何特定的顺序。
如果没有一个ORDER BY
来强制选择一个确定性子集,那么重复执行相同的 LIMIT
查询返回不同的表行的子集甚至都是可能的。同样, 这不是一个漏洞;结果的确定在这种情况下没法保证。
锁定子句
FOR UPDATE
, FOR NO KEY UPDATE
, FOR SHARE
和 FOR KEY SHARE
是 锁定子句;他们影响 SELECT
如何从表中锁定行作为获得的行。
锁定子句的一般形式:
FOR _lock_strength_ [ OF _table_name_ [, ...] ] [ NOWAIT ]
这里的_lock_strength_
可以是下列之一:
UPDATE
NO KEY UPDATE
SHARE
KEY SHARE
FOR UPDATE
令那些被SELECT
检索出来的行被锁住, 就像要更新一样。这样就避免它们在当前事务结束前被其它事务修改或者删除;也就是说, 其它企图UPDATE
, DELETE
, SELECT FOR UPDATE
, SELECT FOR NO KEY UPDATE
, SELECT FOR SHARE
或 SELECT FOR KEY SHARE
这些行的事务将被阻塞,直到当前事务结束。 FOR UPDATE
锁模式也可以通过在一个行上DELETE
或在特定的字段上修改值的 UPDATE
获得。目前,为UPDATE
情况考虑的字段设置是那些有唯一索引并且可以用于外键的 (所以不考虑局部索引和表达式索引),但是这个可能会在将来改变。同样, 如果一个来自其它事务的UPDATE
, DELETE
, SELECT FOR UPDATE
已经锁住了某个或某些选定的行,SELECT FOR UPDATE
将等到那些事务结束,并且将随后锁住并返回更新的行(或者不返回行,如果行已经被删除)。 但是,在REPEATABLE READ
或SERIALIZABLE
事务内部, 如果在事务开始时要被锁定的行已经改变了,那么将抛出一个错误。更多的讨论参阅Chapter 13。
FOR NO KEY UPDATE
的行为类似,只是获得的锁比较弱:这个锁将不锁定 尝试在相同的行上获得锁的SELECT FOR KEY SHARE
命令。 这个锁模式也可以通过任何不争取FOR UPDATE
锁的UPDATE
获得。
FOR SHARE
的行为类似,只是它在每个检索出来的行上要求一个共享锁, 而不是一个排它锁。一个共享锁阻塞其它事务在这些行上执行UPDATE
, DELETE
, SELECT FOR UPDATE
或 SELECT FOR NO KEY UPDATE
,却不阻止他们执行SELECT FOR SHARE
或 SELECT FOR KEY SHARE
。
FOR KEY SHARE
的行为类似于FOR SHARE
,只是锁比较弱: 阻塞SELECT FOR UPDATE
但不阻塞SELECT FOR NO KEY UPDATE
。 一个共享键块阻塞其他事务执行DELETE
或任意改变键值的UPDATE
, 但是不阻塞其他UPDATE
,也不阻止SELECT FOR NO KEY UPDATE
, SELECT FOR SHARE
, 或 SELECT FOR KEY SHARE
。
为了避免操作等待其它事务提交,使用NOWAIT
选项。如果被选择的行不能立即被锁住, 那么语句将会立即汇报一个错误,而不是等待。请注意,NOWAIT
只适用于行级别的锁, 要求的表级锁ROW SHARE
仍然以通常的方法进行(参阅Chapter 13)。 如果需要申请表级别的锁同时又不等待,那么你可以使用LOCK的 NOWAIT
选项。
如果在锁定子句中明确指定了表名字,那么将只有这些指定的表被锁定,其他在 SELECT
中使用的表将不会被锁定。 一个其后不带表列表的锁定子句将锁定该声明中所有使用的表。 如果锁定子句应用于一个视图或者子查询,它同样将锁定所有该视图或子查询中使用到的表。 但是这些子句不适用于被主查询引用的WITH
查询。 如果你想要行锁定发生在WITH
查询中,那么在WITH
查询中指定锁定子句。
多个锁定子句可以用于为不同的表指定不同的锁定模式。如果一个表出同时出现 (或隐含同时出现)在多个锁定子句中,那么将看做只被最强的那个声明了处理。 类似的,如果影响一个表的任意子句中出现了NOWAIT
, 那么该表将按照NOWAIT
处理。
锁定子句不能在那些无法使用独立的表行清晰标识返回行的环境里使用;比如,它不能和聚集一起使用。
当锁定子句出现在SELECT
查询的顶层时,锁定的行恰好是被查询返回的行; 在连接查询的情况下,锁定的行是那些有助于返回连接的行。另外, 满足查询条件的行作为查询快照将被锁定,尽管如果在快照后他们被更新不再满足查询条件 就不再被返回。如果使用了LIMIT
,那么一旦返回足够的行满足限制锁定将停止 (但是请注意,通过OFFSET
跳过的行将被锁定)。相似的,如果锁定子句用于游标查询, 只有实际抓取到的行或通过游标跳过的行将被锁定。
当锁定子句出现在子SELECT
中时,锁定的行是那些通过子查询返回到外查询的行。 这些包含的行可能比单独检查子查询时给出的行更少,因为外查询的条件可能会用来优化子查询的执行。 例如:
SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss WHERE col1 = 5;
将只锁定col1 = 5
的行,即使那个条件不是子查询中的原文。
以前的版本未能保持锁,通过一个稍后的保存点来改善。例如,这段代码:
BEGIN;
SELECT * FROM mytable WHERE key = 1 FOR UPDATE;
SAVEPOINT s;
UPDATE mytable SET ... WHERE key = 1;
ROLLBACK TO s;
FOR UPDATE
锁将会在ROLLBACK TO
之后无法保持。这在版本9.3中已经修复了。
Caution |
---|
一个SELECT 命令运行在READ COMMITTED 事务隔离级别和使用 ORDER BY 和一个锁定子句返回顺序混乱的行是可能的。这是因为ORDER BY 先生效。命令排序结果,但是可能会在其中一行或多行上获取锁的时候被阻塞。一旦SELECT 的阻塞被解除后,某些顺序字段值可能被修改,导致这些行混乱了(尽管他们还是原先字段值的顺序)。 可以在需要的时候通过在子查询中放置FOR UPDATE/SHARE 子句来避开,例如 |
SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss ORDER BY column1;
请注意这将导致锁定mytable
的所有行,而顶层的FOR UPDATE
将会实际上仅锁住返回行。这可能会产生一个显著的性能差异,尤其是如果ORDER BY
与LIMIT
或者其他限制结合。仅当顺序列的并发更新是预期的并且需要一个严格的排序结果时, 该技术才是建议使用的。
在REPEATABLE READ
或SERIALIZABLE
事务隔离级别, 这可能会导致一个序列化失败(SQLSTATE
为'40001'
), 所以在这些隔离级别下接收次序混乱的行是不可能的。 |
TABLE
命令
命令:
TABLE _name_
完全等价于:
SELECT * FROM _name_
它可以用作复杂查询中的一部分的一个顶级的命令或者一个节省空间的语法变体。
例子
将表films
和表distributors
连接在一起:
SELECT f.title, f.did, d.name, f.date_prod, f.kind
FROM distributors d, films f
WHERE f.did = d.did
title | did | name | date_prod | kind
-------------------+-----+--------------+------------+----------
The Third Man | 101 | British Lion | 1949-12-23 | Drama
The African Queen | 101 | British Lion | 1951-08-11 | Romantic
...
统计用kind
分组的每组电影的长度len
总和:
SELECT kind, sum(len) AS total FROM films GROUP BY kind;
kind | total
----------+-------
Action | 07:34
Comedy | 02:58
Drama | 14:28
Musical | 06:42
Romantic | 04:38
统计用kind
分组的每组电影的长度len
总和不足五小时的组:
SELECT kind, sum(len) AS total
FROM films
GROUP BY kind
HAVING sum(len) < interval '5 hours';
kind | total
----------+-------
Comedy | 02:58
Romantic | 04:38
下面两个例子是根据第二列(name
)的内容对单独的结果排序的相同的方法:
SELECT * FROM distributors ORDER BY name;
SELECT * FROM distributors ORDER BY 2;
did | name
-----+------------------
109 | 20th Century Fox
110 | Bavaria Atelier
101 | British Lion
107 | Columbia
102 | Jean Luc Godard
113 | Luso films
104 | Mosfilm
103 | Paramount
106 | Toho
105 | United Artists
111 | Walt Disney
112 | Warner Bros.
108 | Westward
下面这个例子演示如何获得表distributors
和actors
的连接, 只将每个表中以字母 W 开头的取出来。因为只取了不重复的行,所以关键字ALL
被省略了:
distributors: actors:
did | name id | name
-----+-------------- ----+----------------
108 | Westward 1 | Woody Allen
111 | Walt Disney 2 | Warren Beatty
112 | Warner Bros. 3 | Walter Matthau
... ...
SELECT distributors.name
FROM distributors
WHERE distributors.name LIKE 'W%'
UNION
SELECT actors.name
FROM actors
WHERE actors.name LIKE 'W%';
name
----------------
Walt Disney
Walter Matthau
Warner Bros.
Warren Beatty
Westward
Woody Allen
这个例子显示了如何在FROM
子句中使用函数,包括带有和不带字段定义列表的。
CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS $$
SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;
SELECT * FROM distributors(111);
did | name
-----+-------------
111 | Walt Disney
CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS $$
SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;
SELECT * FROM distributors_2(111) AS (f1 int, f2 text);
f1 | f2
-----+-------------
111 | Walt Disney
这个例子显示了如何使用一个简单的WITH
子句:
WITH t AS (
SELECT random() as x FROM generate_series(1, 3)
)
SELECT * FROM t
UNION ALL
SELECT * FROM t
x
--------------------
0.534150459803641
0.520092216785997
0.0735620250925422
0.534150459803641
0.520092216785997
0.0735620250925422
请注意WITH
查询只评估一次,所以我们获得两组相同的三个随机值。
这个例子使用WITH RECURSIVE
从一个只显示直接属下的表中找到所有职员Mary的属下(直接或间接),和他们的间接级别,
WITH RECURSIVE employee_recursive(distance, employee_name, manager_name) AS (
SELECT 1, employee_name, manager_name
FROM employee
WHERE manager_name = 'Mary'
UNION ALL
SELECT er.distance + 1, e.employee_name, e.manager_name
FROM employee_recursive er, employee e
WHERE er.employee_name = e.manager_name
)
SELECT distance, employee_name FROM employee_recursive;
请注意递归查询的典型形式:一个初始条件,紧接着是UNION
, 然后是查询的递归部分。确定查询的递归部分最终将不会返回元组,否则查询将无限循环下去。 (请参阅Section 7.8获取更多示例。)
这个例子使用LATERAL
为manufacturers
表的每行应用一个设置返回函数 get_product_names()
:
SELECT m.name AS mname, pname
FROM manufacturers m, LATERAL get_product_names(m.id) pname;
当前没有任何产品的制造商将不会出现在结果中,因为这是一个内连接。 如果我们希望在结果中包括这种制造商的名字,我们可以这样做:
SELECT m.name AS mname, pname
FROM manufacturers m LEFT JOIN LATERAL get_product_names(m.id) pname ON true;
兼容性
SELECT
语句和 SQL 标准兼容。但是还有一些扩展和一些缺少的特性。
省略 FROM
子句
PostgreSQL允许在一个查询里省略FROM
子句。 它的最直接用途就是计算简单的常量表达式的结果:
SELECT 2+2;
?column?
----------
4
其它有些SQL数据库不能这么做,除非引入一个单行的伪表做为 SELECT
的数据源。
请注意,如果没有声明FROM
子句,那么查询不能引用任何数据库表。 比如,下面的查询是非法的:
SELECT distributors.* WHERE distributors.name = 'Westward';
PostgreSQL 8.1 之前的版本支持这种形式的查询, 为查询里引用的每个表都增加一个隐含的条目到FROM
子句中。 现在这个不再是允许的了。
省略 AS
关键字
在SQL标准中,每当新列名称是一个有效的列名时(也就是,与任意保留关键字都不同), 可选的关键字AS
可以在输出列名之前省略。PostgreSQL 限制略多一些:不管是保留还是不保留,如果新列名匹配任何关键字,AS
是必要的。 建议的做法是使用AS
或者双括号括起输出列名称,以阻止与将来补充的关键字有任何可能的冲突。
在FROM
项中,标准和PostgreSQL都允许AS
在一个无限制关键字别名之前省略。但是这对输出列名是不切实际的,因为语法的歧义。
ONLY
和继承
SQL标准需要在写ONLY
时括号括起表名,例如 SELECT * FROM ONLY (tab1), ONLY (tab2) WHERE ...
。 PostgreSQL认为括号是可选的。
PostgreSQL允许写一个尾随的*
以明确指定包括子表的非 ONLY
行为。标准不允许这样。
(该点同样适用于所有支持ONLY
选项的SQL命令。)
FROM
中的函数调用
PostgreSQL允许把函数调用直接写作FROM
列表的一个成员。 在SQL标准中应该有必要在子SELECT
中包含这样一个函数;也就是, 该语法FROM
_func_
(...) _alias_
等价于 FROM LATERAL (SELECT
_func_
(...)) _alias_
。 请注意LATERAL
被认为是隐含的;这是因为标准要求LATERAL
语义为 一个在FROM
中的UNNEST()
条目。PostgreSQL 对待UNNEST()
和其他设置返回函数相同。
GROUP BY
和 ORDER BY
里可用的命名空间
在 SQL-92 标准里,ORDER BY
子句只能使用输出字段名或者编号, 而GROUP BY
子句只能用基于输入字段名的表达式。PostgreSQL 对这两个子句都进行了扩展,允许另外一种选择(但是如果存在歧义,则使用标准的解释)。 PostgreSQL还允许两个子句声明任意的表达式。 请注意在表达式中出现的名字总是被当作输入字段名,而不是输出字段名。
SQL:1999 以及之后的一个略微不同的定义并不能和 SQL-92 完全向前兼容。不过, 在大多数情况下,PostgreSQL将把一个ORDER BY
或GROUP BY
表达式解析成为 SQL:1999 制定的那样。
函数依赖
PostgreSQL只在表的主键包含在GROUP BY
列表中时识别函数依赖(允许在GROUP BY
中省略字段)。 SQL标准指定应该被识别的附加条件。
WINDOW
子句限制
SQL标准为窗口_frame_clause_
提供了附加选项。 PostgreSQL目前仅支持上面列出的选项。
LIMIT
和 OFFSET
子句LIMIT
和OFFSET
是PostgreSQL 特定的语法,也是MySQL使用的。SQL:2008标准引入了 OFFSET ... FETCH {FIRST|NEXT} ...
获取相同的功能, 如上面的LIMIT 子句子句所示。 该语法也被IBM DB2使用。(为Oracle 所写的应用程序通常使用一个涉及自动生成的rownum
列的工作区, 来实现这些子句的效果,这在PostgreSQL中是不可用的。)
FOR NO KEY UPDATE
, FOR UPDATE
, FOR SHARE
, FOR KEY SHARE
尽管FOR UPDATE
出现在了SQL标准中,但是标准只允许它作为DECLARE CURSOR
的一个选项。PostgreSQL允许它出现在任意SELECT
查询和子SELECT
查询中,但是这是一个扩展。FOR NO KEY UPDATE
, FOR SHARE
, FOR KEY SHARE
变体和NOWAIT
选项, 没有出现在标准中。
WITH
中的数据修改语句
PostgreSQL允许INSERT
, UPDATE
, DELETE
用作WITH
查询。这在SQL标准中是没有的。
非标准的子句
子句DISTINCT ON
在SQL标准中未定义。