![]() |
1
2
我使用aproach,在这里我将一个条件分割放入数据流。不符合条件(无效日期、所需字段中没有数据等)的记录随后被发送到异常表,该表包括记录标识符、错误数据、失败原因。稍后,您可以根据此信息创建一个包含错误的电子表格或文本文件,以发送回提供该文件的组。好的记录当然会转到pther路径并插入到表中。 |
![]() |
2
0
在加载到staging(您称之为初始表)表之前进行一些清理/转换怎么样?将excel中的数据转储到一个制表符或逗号分隔的文件中,然后使用您选择的一些编程语言来执行您已注意到的数据清理。另外,每个数据负载有多大?您可以使用多线程或多进程应用程序来处理主要负载(例如一次加载几百万行)。在此过程中,您遇到的任何错误都可以加载到包含标识符、错误和注释详细信息的异常表中。这种技术有助于在数据清理阶段进行更好的控制。 如果负载没有那么高,并且您希望在数据库(sql)中完成大部分工作,那么您可能希望尽可能多地进行数据分析,并充分了解可能的数据变化。使用它,您可以使用适当的组件(talend或ssis)来执行转换或控制数据流。此外,通过使用正则表达式,您可以捕获任何偏离设置规则的实体。 |