作者:陈剑冬 历史版本:1 最后编辑:陈剑冬 更新时间:2024-05-27 17:04
功能简介
合并记录是用于将两个不同来源的数据合并,这两个来源的数据分别为旧数据源和新数据源,该步骤将旧数据和新数据按照指定的关键字匹配、比较、合并。
基本配置
- 步骤名称:指定合并记录的步骤名称,该名称在同一转换中唯一。
- 旧数据源:选择被比较的原始引用行的输入源。
- 新数据源:选择比较行的输入源。
- 标志字段:指定一个字段名称,该字段名称将包含指示如何在输出行中比较和合并值的标志。
- 匹配的关键字:用于定位两个数据源中的同一条记录。
- 数据字段:对于两个数据源中的同一条记录中,指定需要比较的字段。
合并后的数据将包括旧数据来源和新数据来源的所有数据,对于变化的数据将用新数据代替旧数据,同时在结果中用一个标示字段,来指定新旧数据的比较结果。
需要注意的是:旧数据和新数据需要事先按照关键字段排序,旧数据和新数据需要有相同的字段名称。
根据字段数据的状态分为四种数据状态,分别为:
- “identical”:旧数据和新数据一样。
- “changed”:数据发生了变化,主要是数据字段的格式发生改变。
- “new”:新数据中有而旧数据中没有的记录。
- “deleted”:旧数据中有而新数据中没有的记录。
使用示例
需求:现有两张test_gl1和test_gl2表,要求将两张表数据合并,且比较zfc字段的修改记录。
设计转换
设置合并记录,比较两张表的zfc字段,并把状态标志存储在flagfield字段中
点击运行,查看输出结果
两张表字段已合并,且合并字段的修改状态也已经标出: