Manual Data Stage PDF
Manual Data Stage PDF
Introduccin
En el siguiente documento se proceder a mostrar la funcionalidad de los Stages de una
manera que sea fcil de entender y su rpida aplicacin, A continuacin se dar una breve
explicacin de lo que es Data Stages a grandes rasgos
Datastage es una herramienta que permite crear rpidamente procesos ETL. Se basa
bsicamente en una arquitectura Cliente-Servidor (en sus versiones ms nuevas puede ser
hasta una arquitectura de 4 capaz). Puede acceder a distintos orgenes de datos y lo hace
ideal para realizar las tareas de carga de datos a un Data Warehouse o Data Mart, aunque
tambin se puede utilizar en cualquier proyecto que requiera mover datos desde un origen
a un destino. Las tareas (o Jobs) son compilados y se crean ejecutables que luego pueden
ser ejecutados mediante la misma herramienta o por lnea de comandos.
En la actualidad existen varias versiones de la herramienta pero la ms popular es la
Enterprise Edition que posee los dos motores de tareas que posee la herramienta (server
engine y parallel engine)
Ejercicio DataStage
2
Extraccin
Tener en cuenta que hay que cambiar los nombres de los link y de los procesos
dependiendo a que proceso corresponda.
tipo de delimitador tiene nuestros datos en este caso tiene un | que se est usado para
separar los datos, luego de eso vamos a la opcin Quote donde tendremos que seleccionar
si nuestros datos son (Doubl, single o none) en este este caso se est utilizando none.
c) Columns: Una vez realizado las configuraciones en Format vamos a la opcin Columns
donde tendremos que ingresar las columnas de las base datos o archivo plano con sus
respectivos valores (tipo de dato, largo y si null). una vez ingresado todos los datos
correctamente presionan OK.
b) Tranformer traspaso de datos: Como vimos en lo anterior ahora tenemos que traspasar los
datos de origen de la tabla izquierda a la tercera tabla del lado derecho. De esta maneara
habremos dado pase al siguiente proceso.
a) Data Set: A continuacin vamos a las propiedades del Data Set donde bsicamente
tendremos que ingresar la ruta en el text box File donde queremos que se guarde los datos
finales. Una vez ingresado la ruta presionan OK.
Ejercicio DataStage
Transformacin
Paso 1: Lo primero que tenemos que hacer es extraer el proceso final de la extraccin
Data Set copiamos y luego nos dirigimos a la carpeta transformacin donde pegamos el
proceso.
10
Configuracin (Transformacin)
Sequential File (Transformacin): Una vez realizado el esquema nos dirigimos a al
Sequential que pegamos e ingresamos a las propiedades y veremos como se muestra en
la siguiente ilustracin donde tendremos que poner la ruta del Sequential de la extraccin
como mostraremos en la siguiente ilustracin Data Set 2
11
Data Set 2:
A continuacin nos dirigiremos al text box File donde indicamos la ruta de la extraccin
as de esta manera estaremos llamando los datos finales de la extraccin.
12
Sequential File: Posteriormente una vez ya realizado la configuracin del Data Set nos
dirigimos al Sequential File y abrimos las propiedades y ponemos la ruta en el text box File
de los datos de que queremos que se hagan el cruce en Join. (Tener en cuenta que hay
que revisar las columnas)
13
Join: A continuacin nos dirigimos a las propiedades del Join donde tendremos que buscar
las keys para hacer el cruce de los datos y luego filtrarlos a un tranformer o un data set
dependiendo lo que se necesite, en este caso solo est capturando una sola key como se
muestra en la siguiente ilustracin pero no siempre es una sola key en la siguiente
ilustracin, mostraremos como agregar ms keys al Join en la siguiente ilustracin.
14
15
Join (Mapping): Luego de haber agregado las key(s) nos dirigimos a la pestaa Output y
Mapping donde le aparecer solo la tabal Columns llena donde ustedes tendrn que
seleccionar toda la tabla y arrastrarla a la tabla del lado derecho.
16
Join (Columns): En la pestaa Columns solo tendremos que verificar si los datos son correctos
pero por lo general una ver traspasado los datos del Mapping estas se agregan automticamente.
17
18
Remove Duplicates: Como ya visto en el Join este proceso tiene el mismo mecanismo,
hay que extraer la key luego dirigirse a Output y hacer el Mapping y verificar las Columnas.
19
20
21
22
Data Set: Una vez realizado el Transformer nos dirigimos al Data set en donde este ser vuestro
paso final para terminar la transformacin, una vez ms abrimos en las propiedades en donde se
nos mostrara la siguiente interfaz en la cual tendremos que especificar en el Text box file la
ruta en donde queremos que se guarde.
23
Ejercicio DataStage
Carga
24
Configuracin (Carga)
Data Set (Final transformacin): Como mencionado en lo anterior tenemos que copiar
el data set final de la transformacin para luego pegarlo en el Job de carga una vez echo
eso vamos a las propiedades del data set donde tendremos que pegar la ruta del data set
de la transformacin como se muestra en la siguiente ilustracin. (tener en cuenta que si
no copias bien la ruta los datos no se traspasaran con xito).
25
Tranformer (Carga): Una vez realizado el proceso anterior nos dirigimos al tranformer
donde abrimos las propiedades y hacemos los mismos pasos que llevas haciendo en todo
el manual en el tranformer como se muestra en la siguiente ilustracin.
26
Data Set (Carga): Este sera el ltimo paso para realizar la serie de extraccin,
transformacin y carga. Lo que tenemos que hacer es dirigirnos a las propiedades del data
set y especificar la ruta donde va ser destinado los datos y de esta manera usted habr
completado la serie de los Jobs.
27