El Valor de la Gestión de Datos

Almacén de datos Cloud y catálogos de datos inteligentes

Escrito por Redacción PowerData | 10/11/20 12:00

La migración a la Nube está a la orden del día. Las ventajas para el negocio a nivel de escalabilidad, flexibilidad, velocidad y agilidad, ya no se cuestionan. Y esto hace que más y más compañías trasladen sus cargas de trabajo al Cloud y prefieran manejar la gestión de sus datos empresariales y el almacenamiento en la Nube.

Una investigació de 2019 mostraba que:

  • El 56% de las organizaciones ya tenía un almacén de datos en la Nube Cloud data warehouse
  • El 48% tenía un lago de datos allí
  • El 45% lo usaba para el aprendizaje automático.

 

Por su parte otro estudio de 2020 encontró que:

  • Más del 80% cree que la integración de datos es esencial para las operaciones comerciales actuales
  • El 65% prefiere implementarla en la Nube o nube híbrida.  

 

Como se ve, cada vez más organizaciones encaran la modernización de su almacén de datos en la Nube y sus data lakes, a fin de integrar mejor los nuevos datos de las aplicaciones en las instalaciones propias y en el Cloud y estar en condiciones de crear sistemas y tecnologías de análisis basadas en IA. Esta modernización pone a disposición más datos y también habilita el autoservicio, para que los usuarios puedan encontrar la información que precisen de modo más veloz.  

 

Quizás te interese seguir leyendo:

Escalando en la nube: crecimiento más fácil para tu empresa

  

Catálogo de datos inteligentes 

Por otra parte, para agilizar el uso del Cloud hoy, muchas compañías recurren a catálogos de datos inteligentes. ¿Por qué razón? Porque necesitan herramientas para gestionar y comprender sus prioridades a nivel de datos –ya que por lo común tanto estos últimos como las cargas de trabajo están distribuidas en parte en entornos de Cloud múltiple, y también en sus data centers locales-.

 

Pero vayamos por partes: ¿qué es un catálogo de datos? Puede definirse como un inventario detallado de todos los activos de datos en una organización y sus metadatos, diseñado para ayudar a los usuarios y profesionales (analistas, administradores de datos y científicos de datos, analistas comerciales, etc.) a encontrar rápidamente los datos más apropiados para cualquier propósito comercial analítico.  

 

El concepto de catálogos puede ser simple, pero cuando se utilizan para dar sentido a grandes cantidades de datos en constante cambio, las capacidades inteligentes marcan la diferencia. ¿Y en qué sentido debe ser inteligente un catálogo de datos? Tiene que ser inteligente a nivel del diseño y de los inventarios y adaptarse a diferentes perfiles y usuarios. Su motor de búsqueda debe apoyar diferentes expectativas y ofrecer sugerencias inteligentes. Y además debe ofrecer una gestión inteligente de metadatos (aplicar etiquetas y reconocer patrones de datos).  

 

Sigue leyendo ¿Cómo lograr una gestión inteligente de datos en la nube?

 

Ansiada visibilidad 

Para migrar los datos exitosamente al Cloud sin perder productividad temporal, las organizaciones deben saber qué información deben migrar, dónde y cuándo hacerlo. Y un catálogo de datos inteligentes es la mejor herramienta para descubrir dónde residen los datos, de dónde proceden, cómo se utilizan y cuánconfiables son.

 

Un catálogo de datos basado en IA con un motor de detección con capacidades de aprendizaje automático puede analizar y catalogar recursos de datos en toda la empresa. De este modo ayuda a identificar los datos más relevantes y fiables y otorga visibilidad continua –sobre las fuentes de datos y el linaje-, algo esencial para minimizar las interrupciones para las aplicaciones y los usuarios, tanto durante como luego de lmigración a la Nube 

 

Las empresas que utilizan un catálogo de datos tienen el doble de probabilidades de informar que están “muy satisfechas” con el acceso a los datos de autoservicio en comparación con las que no lo usan. 

Fuente: Informatica 

 

Ahora bien, para hacer que las iniciativas de modernización de la gestión de datos en el Cloud sean más rápidas y sencillas las organizaciones deben buscar un catálogo de datos inteligentes con cinco capacidades claves 

  • Conectores de datawarehouse locales y en la Nube  
  • Integración con herramientas de gestión de datos en el Cloud
  • Linaje (capacidad de rastrear el origen de los datos rápidamente) 
  • Análisis de impacto
  • Integración con herramientas de visualización y BI

 

Linaje de datos  

El linaje de datos muestra dónde se originan los datos y cómo se mueven a través de la organización. Al obtener visibilidad en este sentido se puede ser mucho más estratégico con respecto a la migración y su impacto. Y justamente el catálogo de datos inteligente es la solución que permite rastrear el origen de los datos de forma interactiva y efectuar análisis de impacto detallados.  

Con un enfoque planificado y una visibilidad integral de todos los datos es posible acelerar la transición al Cloud y asegurar que la migración la modernización del almacén de datos tengan éxito. Y para  ello una solución de catálogo de datos inteligentes resulta clave.  

 

¿Tu organización ya migró el almacén de datos a la Nube?

¿Tienes dudas sobre si incorporar un catálogo de datos inteligente?