自建SQL Server同步至AnalyticDB PostgreSQL_云原生数据仓库 AnalyticDB PostgreSQL版-阿里云帮助中心

数据传输服务DTS（Data Transmission Service）支持将自建SQL Server同步至云原生数据仓库AnalyticDB PostgreSQL版，帮助您轻松实现数据的传输，用于实时数据分析。

前提条件

自建SQL Server数据库支持的版本，请参见同步方案概览。
已创建目标云原生数据仓库AnalyticDB PostgreSQL版实例，如未创建请参见创建实例。
目标云原生数据仓库AnalyticDB PostgreSQL版实例的存储空间须大于自建SQL Server数据库占用的存储空间。

若源实例存在如下任一情况，建议使用RDS SQL Server数据库的备份功能进行同步，详情请参见从自建数据库迁移至RDS 。

数据库超过10个。
单个数据库执行日志备份操作的频率超过1次/小时。
单个数据库执行DDL操作的频率超过100条/小时。
单个数据库的日志量超过20 MB/s。
需要开启CDC（Change Data Capture，变更数据捕获）的表超过1000个。

源库日志存在堆表、无主键表、压缩表、含计算列表等场景。可以执行如下SQL检查源库是否存在这些场景的表：

检查源库堆表信息：

SELECT s.name AS schema_name, t.name AS table_name FROM sys.schemas s INNER JOIN sys.tables t ON s.schema_id = t.schema_id AND t.type = 'U' AND s.name NOT IN ('cdc', 'sys') AND t.name NOT IN ('systranschemas') AND t.object_id IN (SELECT object_id FROM sys.indexes WHERE index_id = 0);

检查无主键表信息：

SELECT s.name AS schema_name, t.name AS table_name FROM sys.schemas s INNER JOIN sys.tables t ON s.schema_id = t.schema_id AND t.type = 'U' AND s.name NOT IN ('cdc', 'sys') AND t.name NOT IN ('systranschemas') AND t.object_id NOT IN (SELECT parent_object_id FROM sys.objects WHERE type = 'PK');

检查源库聚集索引列包含的主键列信息：

SELECT s.name AS schema_name, t.name AS table_name FROM sys.schemas s INNER JOIN sys.tables t ON s.schema_id= t.schema_id WHERE t.type= 'U' AND s.name NOT IN('cdc', 'sys')  AND t.name NOT IN('systranschemas')  AND t.object_id IN (SELECT pk_columns.object_id AS object_id FROM (select sic.object_id object_id, sic.column_id FROM sys.index_columns sic, sys.indexes sis WHERE sic.object_id= sis.object_id AND sic.index_id= sis.index_id AND sis.is_primary_key= 'true') pk_columns LEFT JOIN (SELECT sic.object_id object_id, sic.column_id FROM sys.index_columns sic, sys.indexes sis WHERE sic.object_id= sis.object_id AND sic.index_id= sis.index_id AND sis.index_id= 1) cluster_colums ON pk_columns.object_id= cluster_colums.object_id WHERE pk_columns.column_id != cluster_colums.column_id);

检查源库压缩表信息：

SELECT s.name AS schema_name, t.name AS table_name FROM sys.objects t, sys.schemas s, sys.partitions p WHERE s.schema_id = t.schema_id AND t.type = 'U' AND s.name NOT IN ('cdc', 'sys') AND t.name NOT IN ('systranschemas') AND t.object_id = p.object_id AND p.data_compression != 0;

检查包含计算列表信息：

SELECT s.name AS schema_name, t.name AS table_name FROM sys.schemas s INNER JOIN sys.tables t ON s.schema_id = t.schema_id AND t.type = 'U' AND s.name NOT IN ('cdc', 'sys') AND t.name NOT IN ('systranschemas') AND t.object_id IN (SELECT object_id FROM sys.columns WHERE is_computed = 1);

注意事项


类型	说明
源库限制	待同步的表需具备主键或唯一约束，且字段具有唯一性，否则可能会导致目标数据库中出现重复数据。若同步对象为表级别，且需进行编辑（如表列名映射），单次同步任务的表数量超过5000或时，建议您拆分待同步的表，分批配置多个任务，或者配置整库的同步任务，否则任务提交后可能会显示请求报错。单次同步任务仅支持同步至多10个数据库。当超出数量限制，会出现稳定性和性能问题的风险，此时建议您拆分待同步的表，分批配置任务。数据日志：需开启，备份模式设置为Full，且已成功执行过全量逻辑备份。如为增量同步任务，DTS要求源数据库的数据日志保存24小时以上，如为全量同步和增量同步任务，DTS要求源数据库的数据日志至少保留7天以上（您可在全量同步完成后将数据日志保存时间设置为24小时以上），否则DTS可能因无法获取数据日志而导致任务失败，极端情况下甚至可能会导致数据不一致或丢失。由于您所设置的数据日志保存时间低于DTS要求的时间进而导致的问题，不在DTS的SLA保障范围内。若源库待同步的表需要开启CDC，则需满足以下条件，否则预检查将会失败。 sys.sysservers视图的srvname字段与SERVERPROPERTY函数返回值保持一致。若源库是自建SQL Server，则数据库所有者需是sa；若源库是RDS SQL Server，则数据库所有者需是sqlsa。若源库是企业版，则需为2008及以上版本。若源库是标准版，则需为2016SP1及以上版本。若源库为SQL Server 2017版（包括标准版和企业版），建议升级版本。
其他限制	同步对象的要求：支持结构初始化的对象有Schema、Table、View、Function和Procedure。


同步类型	链路配置费用
库表结构同步和全量数据同步	不收费。
增量数据同步	收费，详情请参见计费概述。


操作类型	SQL操作语句
DML	INSERT、UPDATE、DELETE
DDL	CREATE TABLE


数据库	所需权限	账号创建及授权方法
自建SQL Server	sysadmin	CREATE USER 和用户权限管理
云原生数据仓库AnalyticDB PostgreSQL版实例	LOGIN权限。目标表的SELECT、CREATE、INSERT、UPDATE、DELETE权限。目标库的CONNECT、CREATE权限。目标Schema的CREATE权限。 Copy权限（基于内存batch copy）。	创建数据库账号和用户权限管理

类别	配置	说明
无	任务名称	DTS会自动生成一个任务名称，建议配置具有业务意义的名称（无唯一性要求），便于后续识别。
源库信息	数据库类型	选择 SQL Server 。
	接入方式	选择 ECS自建数据库。
	实例地区	选择自建SQL Server数据库所属地域。
	ECS实例ID	选择自建SQL Server数据库所属ECS实例ID。
	数据库账号	填入自建SQL Server数据库账号，所需权限，请参见数据库账号的权限要求。
	数据库密码	填入该数据库账号对应的密码。
	连接方式	根据需求选择非加密连接或 SSL安全连接。
目标库信息	数据库类型	选择 AnalyticDB PostgreSQL 。
	接入方式	选择云实例。
	实例地区	选择目标 AnalyticDB PostgreSQL 实例所属地域。
	实例ID	选择目标 AnalyticDB PostgreSQL 实例ID。
	数据库名称	填入目标 AnalyticDB PostgreSQL 实例中同步对象所属数据库的名称。
	数据库账号	填入目标 AnalyticDB PostgreSQL 实例的数据库账号，所需权限，请参见数据库账号的权限要求。
	数据库密码	填入该数据库账号对应的密码。

配置	说明
同步类型	固定选中增量同步。默认情况下，您还需要同时选中库表结构同步和全量同步。预检查完成后，DTS会将源实例中待同步对象的全量数据在目标集群中初始化，作为后续增量同步数据的基线数据。
目标已存在表的处理模式	预检查并报错拦截：检查目标数据库中是否有同名的表。如果目标数据库中没有同名的表，则通过该检查项目；如果目标数据库中有同名的表，则在预检查阶段提示错误，数据同步任务不会被启动。
实例级别选择所需同步的DDL和DML	按实例级别选择同步的DDL或DML操作，支持的同步操作，请参见支持同步的SQL操作。
SQLServer增量同步模式	非堆表用日志解析增量同步，堆表用CDC增量同步：优点：支持源库堆表、无主键表、压缩表、含计算列表等场景。链路稳定性较高。能拿到完整的DDL语句，DDL场景支持丰富。缺点： DTS会在源库中创建触发器dts_cdc_sync_ddl、心跳表dts_sync_progress、DDL存储表dts_cdc_ddl_history以及会开启库级别CDC和部分表CDC。解析源库日志做增量同步：优点：对源库无侵入。缺点：不支持源库堆表、无主键表、压缩表、含计算列表等场景。
同步对象	在源库对象框中单击待同步对象，然后单击将其移动至已选择对象框。
映射名称更改	如需更改单个同步对象在目标实例中的名称，请右击已选择对象中的同步对象，设置方式，请参见库表列名单个映射。如需批量更改同步对象在目标实例中的名称，请单击已选择对象方框右上方的批量编辑，设置方式，请参见库表列名批量映射。
过滤待同步数据	支持设置WHERE条件过滤数据，请参见通过SQL条件过滤任务数据。
同步的SQL操作	请右击已选择对象中的同步对象，在弹跳框中选择所需同步的DML和DDL操作，支持的操作，请参见支持同步的SQL操作。

配置	说明
设置告警	是否设置告警，当同步失败或延迟超过阈值后，将通知告警联系人。不设置：不设置告警。设置：设置告警，您还需要设置告警阈值和告警联系人。更多信息，请参见在配置任务过程中配置监控报警。
源库、目标库无法连接后的重试时间	在同步任务启动后，若源库或目标库连接失败则DTS会报错，并会立即进行持续的重试连接，默认持续重试时间为720分钟，您也可以在取值范围（10~1440分钟）内自定义重试时间，建议设置30分钟以上。如果DTS在设置的重试时间内重新连接上源库、目标库，同步任务将自动恢复。否则，同步任务将会失败。

类别	参数	说明
信息配置	计费方式	预付费（包年包月）：在新建实例时支付费用。适合长期需求，价格比按量付费更实惠，且购买时长越长，折扣越多。后付费（按量付费）：按小时扣费。适合短期需求，用完可立即释放实例，节省费用。
	链路规格	DTS为您提供了不同性能的同步规格，同步链路规格的不同会影响同步速率，您可以根据业务场景进行选择，详情请参见数据同步链路规格说明。
	订购时长	在预付费模式下，选择包年包月实例的时长和数量，包月可选择1~9个月，包年可选择1~3年。

前提条件

注意事项

费用说明

支持的同步架构

支持同步的SQL操作

数据库账号的权限要求

准备工作

操作步骤