# Reference:DBlink dblink是一个支持在一个数据库会话中连接到其他数据库的扩展模块。可以实现在不同的数据库之间进行通信和交互。它可以让你在一个数据库中访问另一个数据库的表格和函数,甚至可以在不同的服务器之间进行数据交互。 # DBLINK 安装 在使用dblink之前,需要确保已经安装了dblink扩展。可以使用以下命令进行安装 ```sql CREATE EXTENSION dblink; ``` 通过如下命令查看已经安装的扩展 ```sql select * from pg_extension; ``` 通过如下命令查看可用的扩展 ```sql select * from pg_available_extensions where name like '%dblink%'; ``` # DBLINK 使用 ## dblink_connect  dblink_connect 打开一个到远程数据库的持久连接,只有``超级用户``能够使用 - 语法: dblink_connect(text connstr) 返回 text dblink_connect(text connname, text connstr) 返回 text - 描述: dblink_connect()建立一个到远程数据库的连接。要联系的服务器和数据库通过一个标准的libpq连接串来标识。可以选择将一个名字赋予给该连接。多个命名的连接可以被一次打开,但是一次只允许一个未命名连接。连接将会持续直到被关闭或者数据库会话结束。连接串也可以是一个现存外部服务器的名字。 - 参数: connname 要用于这个连接的名字。如果被忽略,将打开一个未命名连接并且替换掉任何现有的未命名连接。 connstr libpq-风格的连接信息串,例如 hostaddr=127.0.0.1 port=5432 dbname=mydb user=postgres password=mypasswd。此外,还可以是一个外部服务器的名字。 更详细的介绍请参考:https://www.postgresql.org/docs/14/libpq-connect.html#LIBPQ-CONNSTRING - 返回值: 返回状态,它总是OK(因为任何错误会导致该函数抛出一个错误而不是返回)。 - 注解: 如果不可信用户能够访问一个没有采用安全方案使用模式的数据库,应该在开始每个会话时从search_path中移除公共可写的方案。例如,可以把options=-csearch_path=增加到connstr。 这种考虑不是特别针对dblink,它适用于每一种执行任意SQL命令的接口。 只有``超级用户``能够使用dblink_connect来创建无口令认证连接。如果非超级用户需要这种能力,使用dblink_connect_u。 选择包含等号的连接名是不明智的,因为这会产生与在其他dblink函数中的连接信息串混淆的风险。 - 举例: ```sql localdb=# SELECT dblink_connect('mydblink','hostaddr=127.0.0.1 dbname=mydb port=7000 user=username password=123456 connect_timeout=5 options=-csearch_path=public,myschema');  dblink_connect  ----------------  OK (1 row) ``` ## dblink_connect_u dblink_connect_u 不安全地打开一个到远程数据库的持久连接 - 语法: dblink_connect_u(text connstr) 返回 text dblink_connect_u(text connname, text connstr) 返回 text - 描述: dblink_connect_u()和dblink_connect()一样,不过它将允许非超级用户使用任意认证方式来连接。 ## dblink_disconnect  - 语法: dblink_disconnect(text connname) 返回 text - 描述: dblink_disconnect()关闭一个之前被dblink_connect()打开的连接。不带参数的形式关闭一个未命名连接。 - 参数: connname 要被关闭的命名连接的名字。 - 返回值: 它总是OK(因为任何错误会导致该函数抛出一个错误而不是返回) ```sql localdb=# SELECT dblink_disconnect('mydblink');  dblink_disconnect  -------------------  OK (1 row) ``` ## dblink dblink在一个远程数据库中执行一个查询。 - 语法: dblink(text connname, text sql [, bool fail_on_error]) 返回记录集 dblink(text connstr, text sql [, bool fail_on_error]) 返回记录集 dblink(text sql [, bool fail_on_error]) 返回记录集 - 描述: dblink在一个远程数据库中执行一个查询(通常是一个SELECT,但是也可以是任意返回行的 SQL 语句)。 当给定两个text参数时,第一个被首先作为一个持久连接的名称进行查找;如果找到,该命令会在该连接上被执行。 如果没有找到,第一个参数被视作一个用于dblink_connect的连接信息字符串,并且被指出的连接只是在这个命令的持续期间被建立。 - 参数: connname 要使用的连接名。忽略这个参数将使用未命名连接。 connstr 如之前为dblink_connect所描述的一个连接信息字符串。 sql 你希望在远程数据库中执行的 SQL 查询,例如select * from foo。 fail_on_error 如果为真(忽略时的默认值),那么在连接的远端抛出的一个错误也会导致本地抛出一个错误。如果为假,远程错误只在本地被报告为一个 NOTICE,并且该函数不反回行。 - 返回值: 该函数返回查询产生的行。因为dblink能与任何查询一起使用,它被声明为返回record,而不是指定任意特定的列集合。这意味着你必须指定在调用的查询中所期待的列集合 否则DB将不知道会得到什么。 ```sql localdb=# select * from  dblink('mydblink', 'select * from foo', true) as t1(f1 int,f2 text,f3 text[]) where f1 >= 6;  f1 | f2 |     f3      ----+----+------------   6 | g  | {a6,b6,c6}   7 | h  | {a7,b7,c7}   8 | i  | {a8,b8,c8}   9 | j  | {a9,b9,c9} (4 rows) ``` FROM子句的“alias”部分必须指定函数将返回的列名及类型(在一个别名中指定列名实际上是标准 SQL 语法,但是指定列类型是一种DB扩展)。这允许系统在尝试执行该函数之前就理解*将展开成什么,以及WHERE子句中的proname指的什么。在运行时,如果来自远程数据库的实际查询结果和FROM子句中显示的列数不同,将会抛出一个错误。不过,列名不需要匹配,并且dblink并不坚持精确地匹配类型。只要被返回的数据字符串是FROM子句中声明的列类型的合法输入,它就将会成功。 - 注解: 一种将预定义查询用于dblink的方便方法是创建一个视图。这允许列类型信息被埋藏在该视图中,而不是在每一个查询中都拼写出来。 例如: ```sql localdb=# create or replace view remote_foo_view as select * from  dblink('mydblink', 'select * from foo' ) as t1(f1 int,f2 text,f3 text[]); CREATE VIEW localdb=# select * from remote_foo_view where f1 >=6;  f1 | f2 |     f3      ----+----+------------   6 | g  | {a6,b6,c6}   7 | h  | {a7,b7,c7}   8 | i  | {a8,b8,c8}   9 | j  | {a9,b9,c9} (4 rows) ``` ## dblink_exec dblink_exec 在一个远程数据库中执行一个命令 - 语法: dblink_exec(text connname, text sql [, bool fail_on_error]) returns text dblink_exec(text connstr, text sql [, bool fail_on_error]) returns text dblink_exec(text sql [, bool fail_on_error]) returns text - 描述: dblink_exec在一个远程数据库中执行一个命令(也就是,任何不返回行的 SQL 语句)。 当给定两个text参数时,第一个被首先作为一个持久连接的名称进行查找;如果找到,该命令会在该连接上被执行。如果没有找到,第一个参数被视作一个用于dblink_connect的连接信息字符串,并且被指出的连接只是在这个命令的持续期间被建立。 - 参数: connname 要使用的连接名。忽略这个参数将使用未命名连接。 connstr 如之前为dblink_connect所描述的一个连接信息字符串。 sql 你希望在远程数据库中执行的 SQL 命令,例如insert into foo values(0, ‘a’, ‘{“a0”,“b0”,“c0”}’)。 fail_on_error 如果为真(忽略时的默认值),那么在连接的远端抛出的一个错误也会导致本地抛出一个错误。如果为假,远程错误只在本地被报告为一个 NOTICE,并且该函数的返回值被设置为ERROR。 - 返回值: 返回状态,可能是命令的状态字符串或ERROR。 - 例子 ```sql localdb=# SELECT dblink_exec('insert into foo values(21, ''z'', ''{"a0","b0","c0"}'');');  dblink_exec  -------------  INSERT 0 1 (1 row) localdb=# SELECT dblink_exec('insert into foo values(null, ''z'', ''{"a0","b0","c0"}'');', false); NOTICE:  null value in column "f1" violates not-null constraint DETAIL:  Failing row contains (null, z, {a0,b0,c0}).  dblink_exec  -------------  ERROR (1 row) ``` ## dblink_open - 语法: dblink_open(text cursorname, text sql [, bool fail_on_error]) 返回 text dblink_open(text connname, text cursorname, text sql [, bool fail_on_error]) 返回 text - 描述: dblink_open()在一个远程数据库中打开一个游标。该游标能够随后使用dblink_fetch()和dblink_close()进行操纵。 - 参数: connname 要使用的连接名。忽略这个参数将使用未命名连接。 cursorname 要赋予给这个游标的名称。 sql 你希望在远程数据库中执行的SELECT语句,例如select * from pg_class。 fail_on_error 如果为真(忽略时的默认值),那么在连接的远端抛出的一个错误也会导致本地抛出一个错误。如果为假,远程错误只在本地被报告为一个 NOTICE,并且该函数的返回值被设置为ERROR。 - 返回值: 返回状态,OK或者ERROR。 ## dblink_fetch dblink_fetch 从一个远程数据库中的打开的游标返回行 - 语法: dblink_fetch(text cursorname, int howmany [, bool fail_on_error]) 返回 record 集合 dblink_fetch(text connname, text cursorname, int howmany [, bool fail_on_error]) 返回 record 集合 - 描述: dblink_fetch从一个之前由dblink_open建立的游标中取得行。 - 参数: connname 要使用的连接名。忽略这个参数将使用未命名连接。 cursorname 要从中取数据的游标名。 howmany 要检索的最大行数。从当前游标位置向前的接下来howmany个行会被取出。一旦该游标已经到达了它的末端,将不会产生更多行。 fail_on_error 如果为真(忽略时的默认值),那么在连接的远端抛出的一个错误也会导致本地抛出一个错误。如果为假,远程错误只在本地被报告为一个 NOTICE,并且该函数不反回行。 - 返回值 该函数返回从游标中取出的行。要使用这个函数,你将需要指定想要的列集合,如前面dblink中所讨论的。 ## dblink_close  dblink_close 关闭一个远程数据库中的游标 - 语法: dblink_close(text cursorname [, bool fail_on_error]) 返回 text dblink_close(text connname, text cursorname [, bool fail_on_error]) 返回 text - 描述: dblink_close关闭一个之前由dblink_open打开的游标。 - 参数: connname 要使用的连接名。忽略这个参数将使用未命名连接。 cursorname 要关闭的游标名。 fail_on_error 如果为真(忽略时的默认值),那么在连接的远端抛出的一个错误也会导致本地抛出一个错误。如果为假,远程错误只在本地被报告为一个 NOTICE,并且该函数的返回值被设置为ERROR。 - 返回值 返回状态,OK或者ERROR。 - 注解 如果dblink_open开始了一个显式事务块,并且这是这个连接中最后一个保持打开的游标,dblink_close将发出匹配的COMMIT。 ```sql localdb=# select * from dblink_fetch('foo_cur',8,false) as t1(f1 int,f2 text,f3 text[]);  f1 | f2 |     f3      ----+----+------------   0 | a  | {a0,b0,c0}   1 | b  | {a1,b1,c1}   2 | c  | {a2,b2,c2}   3 | d  | {a3,b3,c3}   4 | e  | {a4,b4,c4}   5 | f  | {a5,b5,c5}   6 | g  | {a6,b6,c6}   7 | h  | {a7,b7,c7} (8 rows) localdb=# select * from dblink_fetch('foo_cur',3,false) as t1(f1 int,f2 text,f3 text[]);  f1 | f2 |     f3      ----+----+------------   8 | i  | {a8,b8,c8}   9 | j  | {a9,b9,c9}  21 | z  | {a0,b0,c0} (3 rows) localdb=# select * from dblink_fetch('foo_cur',2,false) as t1(f1 int,f2 text,f3 text[]);  f1 | f2 | f3  ----+----+---- (0 rows) localdb=# select dblink_close('foo_cur');  dblink_close  --------------  OK (1 row) ``` ## dblink_get_connections  dblink_get_connections 返回所有打开的命名 dblink 连接的名称 - 语法: dblink_get_connections() 返回 text[] - 描述: dblink_get_connections返回一个数组,其中是所有打开的命名dblink连接的名称。 - 返回值: 返回一个连接名称的文本数组,如果没有则为 NULL。 - 例子: ```sql localdb=# SELECT dblink_get_connections();  dblink_get_connections  ------------------------  {mydblink} (1 row) ``` ## dblink_error_message  dblink_error_message 得到在命名连接上的最后一个错误消息 - 语法: dblink_error_message(text connname) 返回 text - 描述: dblink_error_message为一个给定连接取得最近的远程错误消息。 - 参数: connname 要使用的连接名。 - 返回值: 返回最后一个错误消息,如果在这个连接上没有错误则返回一个OK。 - 例子: ```sql localdb=# SELECT dblink_error_message('mydblink');  dblink_error_message  ----------------------  OK (1 row) ``` ## dblink_get_pkey dblink_get_pkey 返回一个关系的主键域的位置和域名称 - 语法: dblink_get_pkey(text relname) 返回 dblink_pkey_results 集合 - 描述: dblink_get_pkey提供有关于本地数据库中一个关系的主键的信息。这有时候有助于生成要被发送到远程数据库的查询。 - 参数: relname 一个本地关系的名称,例如foo或者myschema.mytab。如果该名称是大小写混合的或包含特殊字符,要包括双引号,例如"FooBar";如果没有引号,字符串将被折叠到小写形式。 - 返回值: 为每一个主键域返回一行,如果该关系没有主键则不返回行。结果行类型被定义为: CREATE TYPE dblink_pkey_results AS (position int, colname text); position列值可以从 1 到 N,它是该域在主键中的编号,而不是在表列中的编号。 - 例子: ```sql mydb=# select * from dblink_get_pkey('foo');  position | colname  ----------+---------         1 | f1         2 | f2 (2 rows) ``` ## dblink_build_sql_insert dblink_build_sql_insert 使用一个本地元组构建一个 INSERT 语句,将主键域值替换为提供的值 - 语法: dblink_build_sql_insert( text relname,int2vector primary_key_attnums, integer num_primary_key_atts, text[] src_pk_att_vals_array, text[] tgt_pk_att_vals_array) 返回 text - 描述: dblink_build_sql_insert在选择性地将一个本地表复制到一个远程数据库时很有用。它基于主键从本地表选择一行,并且接着构建一个复制该行的INSERT命令,但是其中主键值被替换为最后一个参数中的值(要创建该行的一个准确拷贝,只要为最后两个参数指定相同的值)。 - 参数: relname 一个本地关系的名称,例如foo或者myschema.mytab。如果该名称是大小写混合的或包含特殊字符,要包括双引号,例如"FooBar";如果没有引号,字符串将被折叠到小写形式。 primary_key_attnums 主键域的属性号(从 1 开始),例如1 2。 num_primary_key_atts 主键域的数量。 src_pk_att_vals_array 要被用来查找本地元组的主键域值。每一个域都被表示为文本形式。如果没有行具有这些主键值,则抛出一个错误。 tgt_pk_att_vals_array 要被替换到结果INSERT命令中的主键域值。每一个域被表示为文本形式。 - 返回值: 将要求的 SQL 语句返回为文本。 注解: 自PostgreSQL 9.0 开始,primary_key_attnums中的属性号被解释为逻辑列号,对应于列在SELECT * FROM relname中的位置。之前的版本将属性号解释为物理列位置。如果指示出的列的左边有任意列在该表的生存期内被删除,这两种解释就有区别。 - 例子: ```sql mydb=# SELECT dblink_build_sql_insert('foo', '1 2', 2, '{"0", "a"}', '{"100", "x"}');                  dblink_build_sql_insert                   ----------------------------------------------------------  INSERT INTO foo(f1,f2,f3) VALUES('100','x','{a0,b0,c0}') (1 row) ``` ## dblink_build_sql_delete dblink_build_sql_delete 使用所提供的主键域值构建一个 DELETE 语句 - 语法: dblink_build_sql_delete( text relname, int2vector primary_key_attnums, integer num_primary_key_atts, text[] tgt_pk_att_vals_array) 返回 text - 描述: dblink_build_sql_delete在选择性地将一个本地表复制到一个远程数据库时很有用。它构建一个 SQL DELETE命令用来删除具有给定主键值的行。 - 参数: relname 一个本地关系的名称,例如foo或者myschema.mytab。如果该名称是大小写混合的或包含特殊字符,要包括双引号,例如"FooBar";如果没有引号,字符串将被折叠到小写形式。 primary_key_attnums 主键域的属性号(从 1 开始),例如1 2。 num_primary_key_atts 主键域的数量。 tgt_pk_att_vals_array 要用在结果DELETE命令中的主键域值。每一个域都被表示为文本形式。 - 返回值: 将要求的 SQL 语句返回为文本。 - 注解: 自PostgreSQL 9.0 开始,primary_key_attnums中的属性号被解释为逻辑列号,对应于列在SELECT * FROM relname中的位置。之前的版本将属性号解释为物理列位置。如果指示出的列的左边有任意列在该表的生存期内被删除,这两种解释就有区别。 - 例子: ```sql mydb=# SELECT dblink_build_sql_delete('foo', '1 2', 2, '{"0", "a"}');            dblink_build_sql_delete            ---------------------------------------------  DELETE FROM foo WHERE f1 = '0' AND f2 = 'a' (1 row) ``` ## dblink_build_sql_update dblink_build_sql_update 使用一个本地元组构建一个 UPDATE 语句,将主键域值替换为提供的值 dblink_build_sql_update( text relname, int2vector primary_key_attnums, integer num_primary_key_atts, text[] src_pk_att_vals_array, text[] tgt_pk_att_vals_array) 返回 text - 描述: dblink_build_sql_update在选择性地将一个本地表复制到一个远程数据库时很有用。它从本地表基于主键选择一行,并且接着构建一个 SQL UPDATE命令来复制该行,但是其中的主键值被替换为最后一个参数中的值(要创建该行的一个准确拷贝,只要为最后两个参数指定相同的值)。UPDATE命令总是为该行的所有域赋值 这个函数与dblink_build_sql_insert之间的主要区别是它假定目标行已经存在于远程表中。 - 参数: relname 一个本地关系的名称,例如foo或者myschema.mytab。如果该名称是大小写混合的或包含特殊字符,要包括双引号,例如"FooBar";如果没有引号,字符串将被折叠到小写形式。 primary_key_attnums 主键域的属性号(从 1 开始),例如1 2。 num_primary_key_atts 主键域的数量。 src_pk_att_vals_array 要被用来查找本地元组的主键域值。每一个域都被表示为文本形式。如果没有行具有这些主键值,则抛出一个错误。 tgt_pk_att_vals_array 要用在结果UPDATE命令中的主键域值。每一个域都被表示为文本形式。 - 返回值: 将要求的 SQL 语句返回为文本。 - 注解: 自PostgreSQL 9.0 开始,primary_key_attnums中的属性号被解释为逻辑列号,对应于列在SELECT * FROM relname中的位置。之前的版本将属性号解释为物理列位置。如果指示出的列的左边有任意列在该表的生存期内被删除,这两种解释就有区别。 ```sql mydb=# SELECT dblink_build_sql_update('foo', '1 2', 2, '{"0", "a"}', '{"100", "x"}');                                dblink_build_sql_update                                 --------------------------------------------------------------------------------------  UPDATE foo SET f1 = '100', f2 = 'x', f3 = '{a0,b0,c0}' WHERE f1 = '100' AND f2 = 'x' (1 row) ``` ## 使用dblink加载数据示例及使用限制 - **[使用dblink加载数据示例及使用限制](../userguide/dblink-external-table-import.md)**