Las compañías de todos los sectores aprendieron a priorizar sus datos y la gestión inteligente de los mismos. Evolucionaron hacia el cloud en busca de seguridad y optimización; y ahora llegó el momento de incorporar una plataforma de datos que reúna lo mejor del Data Warehouse (en la nube) y el Data Lake mediante tecnologías que permitan la exploración y la ciencia de datos en la nube. Las condiciones están dadas para optimizar el análisis y la toma de decisiones, veamos cómo.

Hagamos un viaje en el tiempo. Durante varias décadas (1980 en adelante) se habló de almacén de datos, una arquitectura de almacenamiento de información que permitía archivar información estructurada para fines específicos de inteligencia comercial y elaboración de informes. Luego llegó el Big Data y las empresas aprendieron a adorar también a los datos no estructurados (información sin procesar en forma de imágenes, videos o grabaciones de sonido, que representan entre el 80 y el 90% de la información disponible). Esto llevó al desarrollo de Data lakes, y su necesidad de crear política de gobiernos de datos que eviten el caos y el desorden.

El volumen de datos no estructurados crecerá de 33 zettabytes a 175 zettabytes, o 175 mil millones de terabytes para 2025).
Fuente: Consultora ITC
|
En este contexto nace una arquitectura híbrida, que reúne lo mejor del data lake y data warehouse, llamada Data Lakehouses.

Quizás te interese seguir leyendo
Analítica y gestión de datos automatizados: la disrupción inteligente
La promesa de los Data Lakehouses
Simplicidad en la gestión de datos en la nube híbrida, a bajo costo, es la promesa tentadora del Data Lakehouses. Mientras que en la era en la que dominaba el entorno local, muchas de las iniciativas de análisis no lograron proporcionar todo su valor a causa de problemas en la calidad y la gestión de los datos, hoy las organizaciones que desean acelerar sus iniciativas encuentran en el Cloud Lakehouse Data Management la única solución de gestión de datos integral, nativa en el cloud y de nivel empresarial.

El 64% de las organizaciones considera que los problemas de calidad y gestión de los datos constituyen las principales barreras para ofrecer Data Warehouses y Data Lakes en el cloud con éxito. Y el 86% cree que un enfoque sistemático de la gestión de datos en el cloud resulta importante para el éxito de su estrategia de datos.
Fuente: Encuestadora TDWI
|
Tanto en el caso de las empresas ya hayan invertido en Data Warehouses y Data Lakes en el entorno local, como en las que parten desde cero en el cloud, es esencial adoptar el enfoque adecuado sobre la calidad y la gestión de los datos. Desarrollar un plan estratégico y sistémico de la gestión de la información permite a las empresas reducir costos, mejorar la eficiencia y proporcionar información de confianza para la toma de decisiones empresariales. Entre los beneficios por los cuales las empresas eligen dar este paso resaltaremos los siguientes:
- Permite consolidación o modernización la gestión de datos sin riesgos.
- Permite la escalabilidad y agilidad del cloud con una rápida implantación de trabajos.
- Ofrece un rápido retorno de la inversión.
- Aumenta la productividad y ahorra costos gracias a una solución integrada y completa.
- Acelera los proyectos asegurando mayor eficiencia.
- Protege el futuro mediante plataformas en el cloud que cambian con rapidez.
- Reduce plazos de comercialización mediante el desarrollo, implementación y actualización de los proyectos de datos para usuarios nuevos y sin experiencia técnica.
Desde 2021 ganaron presencia proveedores de malla/virtualización de estructuras, pero la promesa de hoy es lograr una plataforma que administre la información estructurada, no estructurada y semiestructurada, para abordar tanto las necesidades de análisis de BI como las necesidades de ciencia de datos.

Sigue leyendo
Hiperautomatización para una transformación digital exitosa
Gestión escalada de datos
Los especialistas advierten que si aún la información de la empresa está muy distribuida y enfrenta dificultades para consolidarse, quizás implementar un Data Lakehouse no sea una prioridad, sino más bien una necesidad posterior, para cuando se haya logrado cierto orden y estén en condiciones de sumar valor.
Lo que viene a aportar el Data Lakehouse es optimización y gestión de la información, pero para eso se requiere de cierto orden preliminar. Además, las empresas deben preguntarse seriamente si esta necesidad de consolidar, simplificar y unir en una sola plataforma satisface tanto la necesidad del almacén como la del lago de datos. Así estarán en condiciones de asegurar las condiciones de una correcta gestión escalada de datos con simultaneidad de usuarios y consultas.

El nuevo enfoque que hace posible el Data Lakehouse se volverá cada vez más popular en la medida en que las empresas entiendan y puedan aplicar su valor de almacenamiento y procesamiento, junto con la IA y el aprendizaje automático. En el viaje por la línea del tiempo que comenzamos al inicio de la nota, este podría ser el paso hacia la madurez del lago de datos combinado y el modelo de almacén de datos que hasta hace poco se consideraba la única opción posible.

¿Está tu empresa lista para gestionar los datos de forma simplificada y a un bajo costo?
