40.3. 声明
所有在块里使用的变量都必须在一个块的声明段里声明。 唯一的例外是一个FOR
循环里的循环变量是在一个整数范围内迭代的, 被自动声明为整数变量。并且同样从游标结果中FOR
循环迭代的循环变量自动被声明为记录变量。
PL/pgSQL变量可以使用任意的SQL数据类型,比如integer
, varchar
和char
等等。
下面是一些变量声明的例子:
user_id integer;
quantity numeric(5);
url varchar;
myrow tablename%ROWTYPE;
myfield tablename.columnname%TYPE;
arow RECORD;
一个变量声明的一般性语法是:
_name_ [ CONSTANT ] _type_ [ COLLATE `_collation_name_` ] [ NOT NULL ] [ { DEFAULT | := } `_expression_` ];
如果给出了DEFAULT
子句,那么它声明了在进入该块的时候赋予该变量的初始值。 如果没有给出DEFAULT
子句,那么该变量初始化为SQL NULL。 CONSTANT
选项避免了该变量被赋值,这样其数值在该块的范围内保持常量。 COLLATE
选项声明变量使用的排序规则(参见Section 40.3.6)。 如果声明了NOT NULL
,那么赋予NULL的数值将运行时导致错误。 所以所有声明为NOT NULL
的变量还必须声明一个非空的缺省值。
缺省值是在每次进入该块的时候计算的,而不是每次调用函数时。 因此,如果把now()
赋予一个类型为timestamp
的变量会令变量拥有函数实际调用的时间, 而不是函数预编译的时间。
例如:
quantity integer DEFAULT 32;
url varchar := 'http://mysite.com';
user_id CONSTANT integer := 10;
40.3.1. 声明函数参数
传递给函数的参数都是用$1
, $2
等等这样的标识符。 为了增加可读性,可以为$``_n_
参数名声明别名。 然后别名或者数字标识符都可以指向参数值。
有两种创建别名的方法,比较好的是在CREATE FUNCTION
命令里给出参数名,比如:
CREATE FUNCTION sales_tax(subtotal real) RETURNS real AS $$
BEGIN
RETURN subtotal * 0.06;
END;
$$ LANGUAGE plpgsql;
另外一个方法(也是PostgreSQL 8.0以前的唯一的方法), 是使用声明语法明确声明别名:
_name_ ALIAS FOR $_n_;
这个风格的同一个例子看起来像下面这样:
CREATE FUNCTION sales_tax(real) RETURNS real AS $$
DECLARE
subtotal ALIAS FOR $1;
BEGIN
RETURN subtotal * 0.06;
END;
$$ LANGUAGE plpgsql;
Note: 这两个例子的作用不是完全一致的。 在第一个例子中,
subtotal
可以作为sales_tax.subtotal
被引用, 而在第二个例子中是不可以的。(我们在内部块中附加标签,反而subtotal
符合这个标签)。
更多例子:
CREATE FUNCTION instr(varchar, integer) RETURNS integer AS $$
DECLARE
v_string ALIAS FOR $1;
index ALIAS FOR $2;
BEGIN 这里放一些使用 v_string 和 index 的计算
END;
$$ LANGUAGE plpgsql;
CREATE FUNCTION concat_selected_fields(in_t sometablename) RETURNS text AS $$
BEGIN
RETURN in_t.f1 || in_t.f3 || in_t.f5 || in_t.f7;
END;
$$ LANGUAGE plpgsql;
如果一个PL/pgSQL函数声明中含有输出参数, 那么就会给予输出参数$``_n_
的名字以及可选的别名, 方法和其它正常输入参数一样。一个输出参数实际上是初始值为 NULL 的变量; 在函数执行的过程中,应该给它赋值。 该参数的最后数值是返回的东西。比如, 销售额-税费的例子也可以这么做:
CREATE FUNCTION sales_tax(subtotal real, OUT tax real) AS $$
BEGIN
tax := subtotal * 0.06;
END;
$$ LANGUAGE plpgsql;
请注意忽略了RETURNS real
—当然也可以包含它,不过这样就显得多余了。
输出参数在返回多个数值的时候非常有用。一个简单的例子是:
CREATE FUNCTION sum_n_product(x int, y int, OUT sum int, OUT prod int) AS $$
BEGIN
sum := x + y;
prod := x * y;
END;
$$ LANGUAGE plpgsql;
正如在Section 35.4.4里面讨论的, 这样做实际上为函数的结果创建了一个匿名的记录类型。如果给出一个 RETURNS
子句,那么它就必须使用 RETURNS record
。
另一个声明PL/pgSQL函数的方法是使用 RETURNS TABLE
,例如:
CREATE FUNCTION extended_sales(p_itemno int)
RETURNS TABLE(quantity int, total numeric) AS $$
BEGIN
RETURN QUERY SELECT quantity, quantity * price FROM sales
WHERE itemno = p_itemno;
END;
$$ LANGUAGE plpgsql;
这完全等价于声明一个或多个OUT
参数, 并且声明RETURNS SETOF``_sometype_
。
如果将PL/pgSQL函数的返回类型声明为多态类型 (anyelement
, anyarray
, anynonarray
, anyenum
, 或者anyrange
), 那么就会创建一个特殊的$0
参数, 它的数据类型是函数的实际返回类型, 和从实际输入类型的推导类型一样 (参阅Section 35.2.5)。这样就允许函数像 Section 40.3.3里显示的那样访问它的实际返回类型。 $0
初始化为空,并且可以被函数修改, 所以,如果需要,它可以用于保存返回值,虽然这并非必须。 $0
还可以给予一个别名。 比如,这个函数可以在任何有+
操作符的数据类型上运转:
CREATE FUNCTION add_three_values(v1 anyelement, v2 anyelement, v3 anyelement)
RETURNS anyelement AS $$
DECLARE
result ALIAS FOR $0;
BEGIN
result := v1 + v2 + v3;
RETURN result;
END;
$$ LANGUAGE plpgsql;
通过将一个或多个输出参数声明为多态类型,可以达到相同的效果。 在这种情况下,特殊的参数$0
不会使用;输出参数自己起这个作用。比如:
CREATE FUNCTION add_three_values(v1 anyelement, v2 anyelement, v3 anyelement,
OUT sum anyelement)
AS $$
BEGIN
sum := v1 + v2 + v3;
END;
$$ LANGUAGE plpgsql;
40.3.2. 别名
_newname_ ALIAS FOR _oldname_;
别名
语法比在之前章节提到的更普遍:可以为任何一个参数声明别名,而不仅仅只是对函数。 这样做的主要目的是为已经有名字的参数重新定义一个名字,例如触发器中的NEW
或者OLD
。
例如:
DECLARE
prior ALIAS FOR old;
updated ALIAS FOR new;
由于ALIAS
创建了两种不同的方式来命名相同的对象,因此,无限制的使用会造成混淆。 最好是在重写预定名称时使用。
40.3.3. 拷贝类型
_variable_%TYPE
%TYPE
提供一个变量或者表字段的数据类型。 你可以用这个声明将要保存数据库数值的变量。比如,假如你 在users
表里面有一个user_id
字段。 要声明一个和users.user_id
类型相同的变量,可以这样写:
user_id users.user_id%TYPE;
通过使用%TYPE
,你无需知道引用的结构的数据类型,并且,最重要的是, 如果被引用项的数据类型在将来变化了(比如把user_id
的类型从integer
改成real
),也不需要修改函数定义。
%TYPE
对多态函数特别有用,因为内部变量的数据类型可能在不同调用中不一样。 可以通过给函数的参数或者结果占位符附加%TYPE
的方法来创建合适的变量。
40.3.4. 行类型
_name_ _table_name_%ROWTYPE;
_name_ _composite_type_name_;
一个复合类型变量叫做行变量(或者row-type变量)。 这样的一个变量可以保存一次SELECT
或者FOR
命令结果的完整一行, 只要命令的字段集匹配该变量声明的类型。 行数值的字段使用点表示法访问,比如rowvar.field
。
行变量可以声明为和一个现有的表或者视图的行类型相同, 方法是使用_table_name_``%ROWTYPE
表示法; 或者你也可以声明它的类型是一个复合类型的名字。 因为每个表都有一个相关联的同名数据类型,在PostgreSQL里实在是无所谓你写不写%ROWTYPE
。但是有%ROWTYPE
的形式移植性更好。
函数的参数可以是复合类型(表的完整行)。 这个时候,对应的标识符$``_n_
将是一个行变量, 并且可以从中选取字段,比如$1.user_id
。
在一个行类型的变量中,只可以访问用户定义的表中行的属性,不包括OID 或者其它系统属性(因为该行可能来自一个视图)。 该行类型的数据域继承表中像char(``_n_
) 这种类型字段的尺寸和精度。
这里是一个使用复合类型的例子。table1
和table2
是现有的表,至少包含代码中提到的字段:
CREATE FUNCTION merge_fields(t_row table1) RETURNS text AS $$
DECLARE
t2_row table2%ROWTYPE;
BEGIN
SELECT * INTO t2_row FROM table2 WHERE ... ;
RETURN t_row.f1 || t2_row.f3 || t_row.f5 || t2_row.f7;
END;
$$ LANGUAGE plpgsql;
SELECT merge_fields(t.*) FROM table1 t WHERE ... ;
40.3.5. 记录类型
_name_ RECORD;
纪录变量类似行类型变量,但是它们没有预定义的结构。它们在SELECT
或者FOR
命令中获取实际的行结构。 一个行变量的子结构可以在每次赋值的时候改变。 这样做的一个结果是:在一个记录变量被赋予数值之前,它没有子结构, 并且任何对其中的数据域进行访问的企图都将产生一个运行时错误。
请注意,RECORD
不是真正的数据类型,只是一个占位符。 还应该意识到在把一个PL/pgSQL函数声明为返回record
类型的时候,它和一个记录变量的概念并不完全相同, 即使这个函数可能使用一个记录变量保存它的结果也如此。 在这两种情况下书写函数的时候,实际的行结构都是未知的, 但是对于返回record
的函数来说, 实际的结构是在调用它的查询被分析的时候决定的,而行变量可以在运行中改变其行结构。
40.3.6. PL/pgSQL变量的排序规则
当PL/pgSQL函数有排序规则数据类型的一个以上的参数时, 排序规则确定每个函数调用依赖于分配给实际参数的排序规则,正如Section 22.2。 如果排序规则成功被识别(比如,在这些参数之间没有隐式排序规则冲突),那么所有 排序规则参数作为有隐式排序规则对待。 这将影响函数内部排序规则敏感操作行为。比如,考虑:
CREATE FUNCTION less_than(a text, b text) RETURNS boolean AS $$
BEGIN
RETURN a < b;
END;
$$ LANGUAGE plpgsql;
SELECT less_than(text_field_1, text_field_2) FROM table1;
SELECT less_than(text_field_1, text_field_2 COLLATE "C") FROM table1;
less_than
的第一次使用出于比较将使用text_field_1
和 text_field_2
的通用排序规则,然而第二次使用将使用C
排序规则。
此外,被识别的排序规则也被假定为任何局部变量是collatable类型的排序规则。 因此这个函数没有任何不同,如果它被写为:
CREATE FUNCTION less_than(a text, b text) RETURNS boolean AS $$
DECLARE
local_a text := a;
local_b text := b;
BEGIN
RETURN local_a < local_b;
END;
$$ LANGUAGE plpgsql;
如果没有collatable数据类型的参数,或者没有通用排序规则可以识别他们,那么参数和局部变量 使用数据类型的缺省排序规则(这往往是数据库的缺省排序规则,但是可能不同于域类型变量)。
collatable数据类型的局部变量可以有与声明中包含COLLATE
选项的相关联的不同排序规则。 比如,
DECLARE
local_a text COLLATE "en_US";
这个选项覆盖排序规则,否则按照上述规则给定变量。
同时,如果期望强迫在特定操作中使用特定排序规则,当然明确的COLLATE
子句可以写 在函数中。
CREATE FUNCTION less_than_c(a text, b text) RETURNS boolean AS $$
BEGIN
RETURN a < b COLLATE "C";
END;
$$ LANGUAGE plpgsql;
这将重写与表列,参数,或者表达式中使用的局部变量相关联的排序规则,正如在纯SQL命令中一样。