作者:陈剑冬  历史版本:1  最后编辑:陈剑冬  更新时间:2024-05-27 17:04

功能简介

合并记录是用于将两个不同来源的数据合并,这两个来源的数据分别为旧数据源和新数据源,该步骤将旧数据和新数据按照指定的关键字匹配、比较、合并。

基本配置


  • 步骤名称:指定合并记录的步骤名称,该名称在同一转换中唯一。
  • 旧数据源:选择被比较的原始引用行的输入源。
  • 新数据源:选择比较行的输入源。
  • 标志字段:指定一个字段名称,该字段名称将包含指示如何在输出行中比较和合并值的标志。
  • 匹配的关键字:用于定位两个数据源中的同一条记录。
  • 数据字段:对于两个数据源中的同一条记录中,指定需要比较的字段。

合并后的数据将包括旧数据来源和新数据来源的所有数据,对于变化的数据将用新数据代替旧数据,同时在结果中用一个标示字段,来指定新旧数据的比较结果。
需要注意的是:旧数据和新数据需要事先按照关键字段排序,旧数据和新数据需要有相同的字段名称

根据字段数据的状态分为四种数据状态,分别为:

  • “identical”:旧数据和新数据一样。
  • “changed”:数据发生了变化,主要是数据字段的格式发生改变。
  • “new”:新数据中有而旧数据中没有的记录。
  • “deleted”:旧数据中有而新数据中没有的记录。

使用示例

需求:现有两张test_gl1和test_gl2表,要求将两张表数据合并,且比较zfc字段的修改记录。

  1. 设计转换

  2. 设置合并记录,比较两张表的zfc字段,并把状态标志存储在flagfield字段中

  3. 点击运行,查看输出结果

    两张表字段已合并,且合并字段的修改状态也已经标出: