Suselinux下infosphere DataStage8.5环境虚拟机文件下载

Suselinux下infosphere DataStage8.5环境虚拟机文件下载,链接:https://pan.baidu.com/s/12VTr-uLTWYCm9U9aj10V_g
提取码:7slm 下载后,用Vmware Worstation 打开,即可以正常使用
IBM® InfoSphere™ Information Server 是一种数据集成软件平台,能够帮助企业从散布在各个系统中的复杂异构信息获得更多价值。InfoSphere Information Server提供了一个统一的平台, 使公司能够了解、清理、变换和交付值得信赖且上下文丰富的信息。
IBM® InfoSphere™ DataStage® and QualityStage™ 提供了图形框架,您可使用该框架来设计和运行用于变换和清理、加载数据的作业。
依靠您具有许可证的那些产品,您可以开发可变换和清理、加载数据的并行作业、可变换数据的服务器作业以及可变换数据的大型机作业。并行作业和服务器作业在 IBM InfoSphere Information Server 引擎上运行。 大型机作业将生成可在大型机上运行的 COBOL 代码。
您可以在 IBM InfoSphere DataStage and QualityStage Designer 客户机中设计作业并在 IBM InfoSphere DataStage and QualityStage Director 客户机中运行这些作业。 作业以项目的形式组织,您可以使用 IBM InfoSphere DataStage and QualityStage Administrator 客户机来管理这些项目。 您可以使用 InfoSphere Information Server Manager 来部署作业设计及其间接材料。

ETL是数据仓库中的非常重要的一环,是承前启后的必要的一步。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。下面给大家介绍一下什么是ETL以及ETL常用的三种工具(Datastage,Informatica,Kettle)!

1.ETL是什么?

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。(数据仓库结构)通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。

2.为什么要用ETL工具?

▶ 当数据来自不同的物理主机,这时候如使用SQL语句去处理的话,就显得比较吃力且开销也更大。

▶ 数据来源可以是各种不同的数据库或者文件,这时候需要先把他们整理成统一的格式后才可以进行数据的处理,这一过程用代码实现显然有些麻烦。

▶ 在数据库中我们当然可以使用存储过程去处理数据,但是处理海量数据的时候存储过程显然比较吃力,而且会占用较多数据库的资源,这可能会导致数据资源不足,进而影响数据库的性能。

上面所说的问题,我们用ETL工具就可以解决。它的优点有:

● 支持多种异构数据源的连接。(部分)

● 图形化的界面操作十分方便。

● 处理海量数据速度快、流程更清晰等。

3.ETL工具介绍

Informatica和Datastage占据国内市场的大部分的份额。

4.ETL工具差异

Kettle,Datastage,Informatica三个ETL工具的特点和差异介绍:

Suselinux下infosphere DataStage8.5环境虚拟机文件下载,链接:https://pan.baidu.com/s/12VTr-uLTWYCm9U9aj10V_g
提取码:7slm 下载后,用Vmware Worstation 打开,即可以正常使用

操作

都是属于比较简单易用,主要是开发人员对于工具的熟练程度。Informatica有四个开发管理组件,开发的时候我们需要打开其中三个进行开发,Informatica没有ctrl+z的功能,如果对job作了改变之后,想要撤销,返回到改变前是不可能的。相比Kettle跟Datastage在测试调试的时候不太方便。Datastage全部的操作在同一个界面中,不用切换界面,能够看到数据的来源,整个job的情况,在找bug的时候会比Informatica方便。Kettle介于两者之间。

阅读更多

使用 ECuRep 与 IBM 软件技术支持互相传送文件

使用 ECuRep 与 IBM 软件技术支持互相传送文件

问题

IBM 软件技术支持人员经常会要求提供文件来帮助解决问题,如何使用ECuRep服务来发送或接收文件?

解决问题

ECuRep, Enhanced Customer Data Repository的缩写,是一个用于在IBM支持中心人员和客户之间交换数据的FTP服务器。这个服务与其他FTP相比的优势是当传送文件时,EcuRep会更新PMR(Problem Management Record 问题管理记录)。所以,当有文件提交时,技术支持代表会被及时通知到。
除了使用FTP,客户还能够通过ECuRep邮件网关用电子邮件发送文件。

更多的关于ECuRep的信息,包括发布和邮寄文件的步骤,可以从如下的ECuRep网站上查找。

http://www.ibm.com/de/support/ecurep

在使用ECuRep之前,请阅读关于出口条例和保密性的服务使用协议。

如下提供了使用这个服务的步骤。

使用邮件向ECuRep发送文件

1.协同工作的技术支持代表会提供给你相应的邮件地址。
2.压缩文件。文件格式可参考下面FTP部分。
3.邮件的标题必须遵循统一的命名规则,这样支持工具可以存储邮件和附件到相应的目录并更新PMR,并以此来表明新的数据可以使用。邮件主题行的命名规则如下:

PMR xxxxx bbb ccc text

其中 xxxxx = the PMR ID, bbb = branch office, ccc = 国家代码, text = 文件的描述

例如: PMR 12345 678 000 这里是诊断文件

4. 一旦你的邮件被处理,会收到一封自动的回复.如果邮件标题不遵循上述规则,就无法关联到PMR,就会被标注为遗弃的邮件,最后会被删掉。

使用FTP上传文件

A. 压缩文件.

如果您在向IBM提交电子数据前对其进行压缩,可以节省您的时间。建议使用下列格式之一:

B.文件命名格式 pmr_#,branch_office_#,country_code,desc.type

例子: 34143,055,000,nsd.zip

文件名格式 xxxxx,bbb,ccc,desc.yyy 。文件名上使用逗号,文件名和文件类型中间使用句号。

解释 例子
xxxxx PMR号码 34143
bbb 部门号 055
ccc IBM地区编号 000
desc 文件的简短描述 nsd
yyy 文件类型后缀 zip 或 tar

(可以在 ECuRep站点上找到地区编号列表。例如, 美国是000,中国大陆 672,台湾 858,香港 738。)

注意: 须使用特定的命名规则; 只有使用正确的文件名,PMR才能够自动更新。

C. 使用FTP工具或软件连接 ftp.ecurep.ibm.com。然后,上传文件到”toibm\lotus”目录。对于Domino zSeries的 terse 压缩的数据,上传文件到”toibm\mvs”。

下面给出了使用DOS命令连接和上传文件的步骤

重要提示:

  • 如果使用FTP客户端或工具,例如FileZilla,文件必须以二进制的格式传输.这是成功上传的关键设置之一。
  • 不要使用需要浏览文件夹来允许上传的FTP客户端或工具,为了保密和安全,ECuRep服务器规定要上传到指定的文件夹并且不允许浏览文件夹。
  • 如果连接不上FTP服务器,检查防火墙和其他造成网络问题的设置。
  • 文件上传后不能更改.如果需要发布一个更新的版本,用一个不同的文件名创建并上传一个新文件。

步骤:
1. 在DOS命令行, 进入上传的文件的目录。例如:

C:\> cd ftpput

2. 在DOS命令行, 键入“ftp”和服务器名 ftp.ecurep.ibm.com, 回车。例如:

C:\FTPPUT> ftp ftp.ecurep.ibm.com

3. 有消息提示通知连接到了请求站点。消息中包含了版权信息和匿名连接的指令。

4. 在用户名提示行,键入”anonymous”按回车,例如:

User id: anonymous

5. 在密码提示下,输入邮件地址,例如:

Password: jdoe@example.com

阅读更多