ETL DataStage实现V15


DB2相关的StageParallel Job中也有三个: DB2/UDB Enterprise, DB2/UDB API, DB2/UDB Load,默认的是DB2/UDB Enterprise,它是用DB2客户端的方式与DB2数据库管理系统进行联接,充分利用DB2实现的特有功能,性能很好,是大数据量操作的首选。这个Job是增量入库,所以在执行前,在Open Command中执行了删除操作。

注:用Sequential File做为源时,在Parallel Job中必须有拒绝文件。

4.4.2    Server Job和Stage

这个Server Job实现的功能与上面的Parallel Job实现的功能完全一样。但是具体到Stage,虽然名称一样,里面的配置方式和可选项却是大不一样。接下来我们就领略一下。先看一下整体风貌


基本一样,就是少了一个拒绝文件,这是因为在Server JobSequential File做为源时,不用拒绝文件。Job Properties中的功能和配置方式基本一样,就不罗嗦了。首先,我们先打开Sequential File,这有什么呀,还能和Parallel Job中不一样?


不是吧,是不是搞错了?很不幸,没有搞错。在接下来的几个Stage中你也会发现相差很大。在Parallel Job中,Stage的参数比较多,除了默认的几个外,还有些备选的,而且都是以文字的形式,一列排下来的,而在Server Job中,参数比较少,都以上面的方式在面板上排放。下面是Format的选项,可以选择的很少,比较简单吧


再看一看Transformer,是不是也变得不认识了


好像没有变,是样子没变,和Parallel Job的功能相差很大。在Server Job中,相对于Parallel Job Stage就少多了,那这些缺少的功能是怎么实现的呢?基本是用Transformer实现的,而Parallel Job中的Transformer的功能倒是相对比较少。

下面就再看看入库的Oracle Stage,在Server Job中没有Oracle Enterprise,也没有DB2 Engterprise,性能上要大大缩水了。

Oracle StageSequential File Stage风格一样,习惯了一个,另一个也就习惯了。


删除的操作,也得放在”SQL“中的”Before“中了,功能同Parallel Job DB2 Enterprise中的”Open Command“了。另外,可以在”Generated“中看到生成的入库的SQL,可以据此判断配置的是否正确。


上面用了两个最简单的JOB做了示例,从示例中可以看到,Server Job与

以下文章点击率最高

Loading…

     

如果这文章对你有帮助,请扫左上角微信支付-支付宝,给于打赏,以助博客运营

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注