El valor de la gestión de datos

9 Características de las herramientas ETL

Posted on Thu, Jul 25, 2013

Los procesos ETL son cruciales en la integración de datos. Aprende más sobre  ellos en este eBook gratuito: "Procesos ETL: La base de la inteligencia de negocio".

En un proceso ETL no todo vale, por eso hay que saber elegir. Para hacerlo con conocimiento de causa es necesario conocer las características más importantes que debe incluir un software ETL.

Según Gartner, son las siguientes:

  • Conectividad / capacidades de adaptación (con soporte a orígenes y destinos de datos): se refiere a la habilidad para conectar con un amplio rango de tipos de estructura de datos, entre los que podrían incluirse: bases de datos relacionales y no relacionales, variados formatos de ficheros, XML, aplicaciones ERP (sistema de planificación de recursos empresariales), CRM (sistema de gestión de clientes) o SCM (supply chain management - gestión de proveedores), formatos de mensajes estándar (EDI, SWIFT o HL7), colas de mensajes, emails, websites, repositorios de contenido o herramientas de ofimática.
  • Capacidades de entrega de datos: suponen la habilidad para proporcionar datos a otras aplicaciones, procesos o bases de datos en varias formas, con capacidades para programación de procesos batch, en tiempo real o mediante lanzamiento de eventos.
  • Capacidades de transformación de datos: habilidad para la transformación de los datos, desde transformaciones básicas (conversión de tipos, manipulación de cadenas o cálculos simples) o transformaciones intermedias (agregaciones, sumarizaciones, lookups) hasta transformaciones complejas, como análisis de texto en formato libre o texto enriquecido.
  • Capacidades de Metadatos y Modelado de Datos: recuperación de los modelos de datos desde los orígenes de datos o aplicaciones, creación y mantenimiento de modelos de datos, mapeo de modelo físico a lógico, repositorio de metadatos abierto (con posibilidad de interactuar con otras herramientas), sincronización de los cambios en los metadatos en los distintos componentes de la herramienta, documentación, etc.
  • Capacidades de diseño y entorno de desarrollo: representación gráfica de los objetos del repositorio, modelos de datos y flujos de datos, soporte para test y, capacidades para trabajo en equipo, gestión de workflows de los procesos de desarrollo, etc.
  • Capacidades de gestión de datos (calidad de datos, perfiles y  minería).
  • Adaptación a las diferentes plataformas hardware y sistemas operativos existentes: mainframes (IBM Z/OS), AS/400, HP Tandem, Unix, Wintel, Linux, Servidores Virtualizados, etc.
  • Operaciones y capacidades de administración: habilidades para gestión, monitorización y control de los procesos de integración de datos, como gestión de errores, recolección de estadísticas de ejecución, controles de seguridad, etc.
  • Arquitectura e integración: grado de compactación, consistencia e interoperabilidad de los diferentes componentes que forman la herramienta de integración de datos (con un deseable mínimo número de productos, un único repositorio, un entorno de desarrollo común, interoperabilidad con otras herramientas o vía API), etc.
  • Capacidades SOA.

Está claro que la elección de un software de ETL puede ser una tarea compleja y, debido a la repercusión que ello tendrá en el desarrollo posterior de un proyecto, es una decisión que no puede tomarse a la ligera. Una elección correcta garantiza:

  • Un aumento en la velocidad de desarrollo del proceso.
  • La descentralización del control de la ejecución y de todos los procesos.
  • Una mayor agilidad en el negocio.
procesos etl guia gratuita

Topics: Data Quality, Data Warehouse