El valor de la gestión de datos

Ventajas en la integración de datos con la herramienta ETL Pentaho

Publicado el 3/06/17 4:00

Pentaho Data Integration, solución tecnológica conocida como Kettel, es una de las herramientas ETL opensource más potentes y versátiles a la hora de diseñar los procesos de integración a la medida de las necesidades de la empresa, fundamentalmente con el objetivo de construir y explotar su Data Warehouse (DW), entre otras utilidades.

ETL PentahoUno de sus aspectos más ventajosos consiste en su capacidad de adaptación, lo que permite desarrollar fácilmente los procesos de integración de datos en el DW, centro de la arquitectura de los sistemas de información, entendidos aquellos como el proceso que consiste en su recolección, cruce, enriquecimiento, consolidación y carga.

Como herramienta ETL, Kettel es visual y consigue una mayor productividad del equipo de desarrollo y mantenimiento, permitiendo conectarse a diversas fuentes y arquitecturas para finamente cargar los datos en un repositorio, si bien también puede utilizarse para otras muchas funciones, como sincronizar, enmascarar, migrar datos entre diferentes aplicaciones o, por ejemplo, para la actualización de usuarios a sistemas paralelos.

Según Gartner, Pentaho es una herramienta líder de ETL, que cumple las características más importantes que ha de incluir un software de este tipo, incluyéndola por primera vez en su informe del año 2009 como software open source de probada eficacia en proyectos de tratamiento de datos que necesiten la construcción de procesos ETL.

En concreto, la consultora subrayó la importancia de que un software ETL idóneo incluya una serie de características, como las siguientes: conectividad, capacidad de entrega de datos, de metadatos y modelados de datos, de diseño y entorno de desarrollo, de gestión de datos de administración, además de capacidades SOA y un cierto grado de compactación, consistencia e interoperabilidad. Por otro lado, todas ellas comunes a las herramientas ETL punteras más completas, ya sea Cognos, Microsoft, Informática ETL o, como alternativa opensource, también Pentaho ETL.

 

Los procesos ETL son cruciales en la integración de datos. Aprende más sobre  ellos en este eBook gratuito: "Procesos ETL: La base de la inteligencia de negocio".

 

Ventajas de ETL Pentaho

Además de las características generales apuntadas por Gartner, que pueden considerarse no sólo ventajosas sino incluso requisitos claves a la hora elegir herramientas de desarrollo ETL, Pentaho suma ventajas interesantes, algunas de ellas derivadas de ser un software libre, si bien al mismo tiempo conlleva inconvenientes frente a soluciones propietarias que, por ejemplo, proporcionan un servicio de soporte al usuario.

  • Gratuidad opensource: su uso no supone un gasto en licencias de software, lo que puede suponer un punto a favor, sobre todo para empresas que empiezan.

  • Edición de pago: también existe una edición de pago (Pentaho BI Suite Enterprise Edition) que sí incluye servicio técnico y aporta soluciones más completas que el software libre.

  • Comunidad amplia: intensa activida a nivel de pruebas beta como en foros, muy útiles para la consulta de posibles problemas, si bien sacarle todo el partido implica un mínimo de especialización.

  • Tecnologías innovadoras y fácil uso: tanto en la versión de pago como en la gratuita, se trabaja con las últimas tecnologías (creado bajo las plataformas de desarrollo de Java y MySQL), sin descuidar una instalación y configuración sencilas.

  • Múltiples programas: ser modular y disponer de aplicaciones para realizar muy distintas funciones, entre ellas la integración de datos, es una de sus grandes ventajas, posibilitando tanto un uso conjunto como independiente en diferentes plataformas.

Se trata, en suma, de una opción que puede resultar interesante a la hora de elegir software para realizar los procesos de integración de una base de datos, con el fin último de realizar una integración de datos inteligente que nos ayude a conseguir la calidad idónea, capaz de maximizar su valor a nivel operativo y de toma de decisiones.

Fuente imagen: mapichai / FreeDigitalPhotos.net

 

Post relacionados:

 

procesos etl guia gratuita

Temas: Data Quality