# Kafka-CDC 任务创建指南 本章节介绍如何创建 Kafka CDC 模式抽取源数据库的任务,以及注意事项。 ## 任务创建流程 1. 首先选择 Kafka 数据源 接着选择模式,这里我们选择 CDC 模式 ![kafka_mode](../integration/task-mode-kafka.png) 选中 CDC 模式的话,在高级配置中需要填写这些关键信息 ![kafka_cdc_config](kafka_cdc_config.png) 这里我们看一下面这串 CDC JSON 数据举例 ``` { "id": 1, "table":"oushu.public.table1", "op": "insert", "ts_ms": 1589362330904, "record":{ "pkid":1, "name": "uzi", "description": "weapon", } } { "id": 2, "table":"oushu.public.table1", "op": "update", "ts_ms": 1589362331234, "record":{ "pkid":1, "name": "ak47", "description": "weapon", } } { "id": 3, "table":"oushu.public.table1", "op": "delete", "ts_ms": 1589362334564, "record":{ "pkid":1 } } ``` * 操作类型路径是描述 JSON 数据中,操作类型的 jsonPath,如样例中格式,则填写 `/op` * 操作类型格式是描述这段 CDC 数据的操作和对应的值,根据'op'字段中的值对应 INSERT:insert UPDATE:update DELETE:delete * 源表信息格式,是用来描述这条 CDC 数据来自哪张表,这里填写对应的 jsonPath,表名需要是全限定表名称,如样例中 CDC 数据中字段'table'已经是全限定表名,所以这里只需要填写`/table`。如果需要db字段和schema字段来组合生成全限定表名,那么需要填写对应的取值路径 测试连接通过后进入到下一步选择处理对象 2. 选择处理对象 这里分为两个步骤 1. 选择 topic,表示从哪些 topic 中获取数据 2. 添加元数据映射(元数据的创建和管理,详情请见[数据源使用手册](../../../../dataend/zh/dataend-user-guide.md)中的“元数据管理”章节),选中元数据后并填写对应的全限定表名,表示这个元数据和哪张源表关联上 ![topic](select_kafka_cdc_topic.png) ![metadata](select_kafka_cdc_metadata.png) 3. 选择数据目标 选择一个 OushuDB 数据目标。 ![image](../selected_oushu_sink.png) 4. 配置列映射 在这里,您可以指定某个元数据对应的表要导入到某张目标表,是否是已有表/自动建表等,如果是自动建表需要手动配置主键。 点击“列映射”可以配置源表到目标表的列对应关系、名称、主键、类型等。 详情请见[使用指南](../../wasp-user-guide.md)中的“创建任务-列映射”章节。 至此,一个从 Kafka CDC 的方式抽取并导入到 OushuDB 的数据集成任务就创建完成了。 ### 返回 [使用指南](../../wasp-user-guide.md)