SHO酱的Blog

SHO酱的Blog

Kettle开发:单条数据记录中的列分隔符分为多行数据

161
2023-08-25

场景举例

同步的数据五花八门,有些数据本应该为每一位同学创建一条数据记录,但有些老师偏偏犯懒,在一条数据中的学生姓名字段中填写了多个姓名。如下。

  • 本应为:

姓名

年龄

性别

张三

18

李四

19

王五

18

刘六

18

  • 犯懒的老师偏偏写成:

姓名

年龄

性别

王五,张三

18

李四

19

刘六

18

解决问题

这时在数据同步时就需要把王五,张三拆成两条记录。

在Kettle中需要用到【Transform】中的【Split field to rows】,图标如下:Kettle2023082501.png打开配置窗口,如图:

Kettle2023082502.png

需要配置的信息:Step name(步骤名称)、Field to split(需要拆分的字段名)、Delimiter(分隔符)、New field name(分隔后的记录中新的字段名)。

参考

kettle开发篇-列拆分为多行-Day14