Del data lake a un modelo más ágil: el mercado de datos

Aprovechar el potencial de los datos es clave para cualquier empresa. Para eso, pasar de un data lake a un mercado de datos es una gran solución.


Las organizaciones confían en los data lakes para almacenar la nueva información que recopilan. No obstante, es bastante común que estos repositorios se conviertan en ámbitos de almacenamiento pasivos, y que con ello se pierdan oportunidades muy valiosas de obtener nueva información de negocio y generar valor comercial a partir de los datos inteligentes. 

Hoy las buenas prácticas invitan a transformar los data lakes en motores activos para responder con agilidad a las necesidades de negocio. Veamos por qué y cómo.

En principio, cabe recordar que un data lake es un entorno de datos compartidos en su formato original (es decir, datos en bruto), que comprende múltiples repositorios y aprovecha las tecnologías de big data. Esta solución puede proporcionar datos para una gran variedad de procesos analíticos. Al centralizar fuentes de contenido dispares, un data lake permite combinarlas y procesarlas empleando big data y efectuar búsquedas y análisis que de otro modo hubieran resultado imposibles.

En definitiva, permite manejar múltiples tipos de datos en sus formatos nativos con un alto grado de flexibilidad, escalabilidad y seguridad.

Este crecimiento estará impulsado por la tendencia a extraer información integral de los datos del consumidor para llevar a cabo estrategias de marketing y ventas. De esta forma es más fácil lograr  una ventaja competitiva, o lo que es más, una ventaja analítica. Esto permitirá también simplificar el acceso a los datos organizacionales de los silos departamentales, mainframe y sistemas heredados. Además, se espera que el cambio hacia plataformas de data warehouse o data lake en la nube (esto es, en el marco de esquemas de Cloud computing) ofrezca oportunidades para una mayor adopción de data lakes.

 

Se estima que el mercado de data lakes pasará de los U$S 7,9 mil millones generados 2019, a U$S 20,1 mil millones en 2024, creciendo a una tasa anual compuesta del 20,6%.

Fuente: Data Lake Market by component

 

Ventaja para crecer

Un estudio encontró que las compañías con data lakes obtuvieron un crecimiento orgánico de los ingresos en un 9% más elevado que sus competidores. ¿Por qué razón? Básicamente porque este modelo les permitió realizar nuevos tipos de análisis, empleando aprendizaje automático sobre nuevas fuentes como archivos de registro, datos de clics, redes sociales y dispositivos conectados a Internet almacenados en el lago de datos. 

Como indica ese mismo informe, las compañías implementan un lago de datos para aprovechar técnicas analíticas más avanzadas y sofisticadas, aplicadas a una base de información más compleja y diversa. Y, además, para hacer que las actividades tradicionales, como el acceso a los datos y la velocidad de recuperación, sean más eficientes y fáciles de realizar.

No obstante, en la práctica es demasiado frecuente que, ante las dificultades para mantener y usar eficientemente los data lakes, éstos degeneren en grandes almacenes de datos pasivos. Para evitarlo, hay que evolucionar hacia un mercado de datos que agilice la detección de nueva información valiosa. Es decir, hay que configurar un data lake activo y ágil que fomente la colaboración para obtener información detallada.  

 

 

Tal vez te interese leer: 
La modernización de la gestión de datos: en la Nube, inteligente y automatizada

 

 

Mercado de datos

Para conformar un mercado de datos es necesario adoptar ciertas prácticas tecnológicas y organizativas, como el diseño orientado a la agilidad, abrazar el modelo colaborativo y de autoservicio y crear una cadena de provisión de datos inteligentes. 

Un data lake eficiente debe permitir que los equipos accedan a él de forma autónoma y descentralizada para obtener la información que requieren. Para ello en principio es necesario que puedan explorar los conjuntos de datos, y que luego puedan prepararlos, para finalmente publicarlos en espacios de trabajo colaborativos. 

Esta tarea requiere tanto de una estrategia como de tecnologías para la gestión de datos y aplicaciones que permitan preparar el dato de manera ágil y flexible. En tal sentido, hoy existen herramientas sofisticadas que incluyen soluciones de inteligencia artificial y machine learning para automatizar procesos. De este modo, y sumando métodos de gobernanza de datos eficaces con aportes colectivos, los analistas pueden mejorar la calidad de los datos (con etiquetas y otros métodos) en un entorno de autoservicio.

Extraer valor de los datos es fundamental para las organizaciones hoy en día. Y esto requiere pasar de un data lake pasivo a un mercado de datos activo. Este modelo ayudará a las empresas a lanzar programas de análisis rápidamente y establecer una cultura amigable con los datos a largo plazo. Además de asegurar la rentabilidad de la inversión tecnológica efectuada, aportará importantes beneficios derivados de la automatización y la democratización en el uso de los datos.

 

¿Cuán activos son los data lakes en tu organización?

Consulta con un experto en Data Lake

 

 

Artículos relacionados

Subscríbete a nuestro blog y recibe las últimas actualizaciones sobre gestión de datos.

Descubre contenido nuevo todos los días para profundizar la transformación digital en tu organización.