El valor de la gestión de datos

Una gestión de datos versátil para la inteligencia de negocio

Posted on Thu, Nov 20, 2014

Pentaho ETL

De algún modo, una gestión de datos inteligente lleva implícita una cierta flexibilidad que permita adaptarse a las diferentes necesidades del negocio, tanto a nivel operativo o funcional como en lo que se refiere al business intelligence (BI) o incluso desde un punto de vista tecnológico, por lo que su versatilidad puede valorarse desde muy distintos enfoques.

Básicamente, se busca encontrar una respuesta a situaciones que exigen soluciones válidas ante situaciones variadas, como una necesidad sobrevenida, los requerimientos propios del BI o, por ejemplo, a la hora de poder realizar fácilmente la implementación de nuevas tecnologías que deban ser integradas en procesos ETL.

En el capítulo de la inteligencia de negocio, como es sabido, se trabaja con diferentes tipos de datos que proceden de distintas fuentes, con lo que la gestión de datos ha de poder conjugar los datos estructurados y desestructurados para la obtención de información que resulte valiosa a la hora de tomar decisiones estratégicas. 

Procesos ETL para un data warehouse flexible

En este punto, la integración mediante procesos ETL juega un papel clave, entendida como un sistema de información que incluye la limpieza de datos y su centralización en un repositorio desde el que poder trabajar de forma flexible en función de las necesidades que tengamos a nivel operacional o de inteligencia de negocio. En este caso, mediante herramientas de reporting que reflejen en gráficas los resultados de datos agregados o, pongamos por caso, para extraer datos de calidad que resulten oportunos para un óptimo cruce de información por los científicos de datos.

En este punto, la versatilidad dependerá tanto de la tecnología disponible como de la capacidad de los analistas para interpretar esa información. El objetivo será aplicar estrategias a partir de los datos facilitados por un diseño ETL que proporcione los datos necesarios y facilite las herramientas adecuadas para sacar conclusiones y poder tomar decisiones. Sin embargo, si buscamos un uso versátil, la utilización que se haga de esos datos dependerá de la preparación y del talento de los data scientist.

Los procesos ETL bien diseñados alimentarán el data warehouse con la inclusión de datos de diferentes fuentes a las que se conecta para reunirlos, no sin antes darles forma (incluyendo la mejora de su calidad) y finalmente guardarlos. De este modo, la herramienta ETL también tendrá una importante utilidad a la hora de realizar la transformación: adaptar los formatos para integrarlos, detectar si faltan atributos o identificar y corregir cualquier otra deficiencia.

A la hora de responder a los cambios y necesidades tecnológicas a lo largo del tiempo, serán interesantes las herramientas que permitan distintas combinaciones. En materia de gestión de datos, las ETL facilitan esa adaptación a los cambios en los orígenes para no dejar de absorber datos ante cambios de herramientas.

Traducido a la práctica, en el hipotético caso de que un departamento trabaje con una herramienta que haya que cambiar porque se queda obsoleta, no se adecua a lo que se quiere o se busca una nueva funcionalidad, se produce un cambio de herramienta. Será entonces cuando el diseño de un ETL deba dar una solución técnica a esa demanda que viene de parte de la empresa. La solución que permita esa adaptación, por último, será definir una nueva conexión a esa herramienta para poder seguir accediendo a los datos.

Fuente imagen: Stuart Miles / FreeDigitalPhotos.net

 

Post relacionados:

 

pdf data management herramientas

Topics: Data Management