Las empresas, sean grandes o pequeñas, manejan una gran cantidad de datos, que pueden almacenar en muchos formatos diferentes, desde bases de datos hasta ficheros sin una estructura definida. Toda esta información debe de ser tratada para que posteriormente puedan generarse informes de negocio, y pueda dar más valor añadido a la empresa.
Se detecta el problema.
Empresa que tiene un volumen alto de información, pero distribuida en muchas fuentes distintas. Tiene muchas herramientas para cada fuente, sin embargo no son capaces de combinarla para su análisis.
Solución: Integración del dato
Las tecnologías de Data Integration son aquellas que permiten que orígenes de diferentes formatos puedan comunicarse entre si, usando una única conexión.
PowerCenter
Powercenter provee herramientas de data integration, permitiendo realizar tareas de datawarehousing con agilidad y flexibilidad.

Desarrollar una ETL en Powercenter ofrece:
- Repositorio centralizado para todos los metadatos.
- Administración centralizada.
- Facilidad de mantenimiento.
- Integración/compatibilidad con la plataforma tecnológica de tu empresa o cliente.
- Rendimiento, escalabilidad y tolerancia a fallos.
- Productividad en el desarrollo: diseño gráfico y debugger paso a paso.
Visión general de los componentes

Repository Manager:
Herramienta para administrar el repositorio.

Mapping Designer:
Herramienta para construir mappings, mapplets…etc donde se puede especificar cómo mover y transformar los datos entre orígenes y destinos.

Workflow Manager:
Herramienta para definir un workflow con un conjunto de instrucciones para ejecutar los mappings que se han definido en el Designer.

Workflow Monitor:
Herramienta para monitorizar tareas y workflows (Gantt Chart view o Task view), desde donde se pueden ejecutar, parar y abortar workflows.
Palabras clave
- Source: Estructura de entrada de datos de fichero plano, fichero cobol, fuente relacional u otras fuentes.
- Target: Estructura de salida de datos a fichero plano, fichero cobol, fuente relacional u otras fuentes.
- Source Qualifier: Lectura de fuentes de datos (fuentes relacionales y ficheros planos).
- Transformación: Objeto dónde se manipula y se traspasa el flujo de datos. Estas transformaciones pueden ser de varios tipos que se explicarán durante la formación.
- Expression: Realiza cálculos a nivel de registro. Se puede utilizar variables anteriores para el manejo de punteros.
- Puerto: Se denomina a un campo de una transformación. Este puerto o campo podrá ser definido de entrada (input) y/o salida (output) o variable.
- Shortcut: Es un link a un Target o a un Source.
- Mapping: Es la unidad dónde se diseña el programa que necesariamente extrae, transforma y carga los datos.
- Mapplet: Objeto reutilizable que puede ser instanciado desde muchos mappings. Fragmento de mapping que tratará como una sola pieza y podrá ser incluido dentro de otro mapping.
- Session: Este objeto hace referencia a un mapping y es el objeto dónde se define la información necesaria para su ejecución.
- Workflow: Este objeto esta formado por tareas que extraerán, transformarán y cargarán datos. Desde este objeto se ejecutan los
programas diseñados. - Worklet: Fragmento de workflow que se tratará como una sola pieza y podrá ser utilizado en otros workflows
- Repositorio: Almacén central dónde PowerCenter almacena todos los datos (diseños, conexiones, usuarios, carpetas,….).