El valor de la gestión de datos

Data Archiving Solutions para Big Data

Posted on Tue, Oct 27, 2015

Data Archiving solutions para big data

La identificación y movimiento de datos inactivos fuera del sistema productivo para maximizar la eficiencia, fin principal del data archiving, resulta especialmente interesante cuando nuestro objetivo es almacenar y sacar partido de los grandes datos. 

Aunque el data archiving es muy anterior al boom actual de los grandes datos, las características de estos sistemas especializados resultan muy útiles para almacenar enormes cantidades de información inactiva con la que poder trabajar en el futuro. 

 

Como es bien sabido, actualmente existe mucha información estructurada y no estructurada, y resulta de gran importancia poder manejarla de forma eficiente. En este sentido, las soluciones de data archiving se revelan como un valioso instrumento para Big Data y, de hecho, es común su uso para poder recuperar información en un momento dado. 

 

¿Tienes dudas de cómo empezar tu proyecto de Big Data? Resuelve tus dudas con  un experto

 

 

El data archiving nos permite trabajar con herramientas y frameworks de Big Data gracias a sus funcionalidades, que hacen posible hacerlo de forma accesible, incluso realizando consultas online si conviniese y, para mayor seguridad, también nos proporciona un entorno aislado. 

A su vez, utilizan algoritmos de compresión de datos que son muy eficientes en el ahorro de espacio y, por lo tanto, también de costes. Sobre todo, teniendo en cuenta que la potencia que hoy caracteriza a los CPU hace que el costo de usar la información comprimida sea despreciable. 

La data archiving enriquece el análisis de Big Data

La analítica de Big Data, en efecto, puede beneficiarse del data archiving. El uso de los datos archivados alimenta un sistema de trabajo que recaba información de todo tipo (estructurada o no estructurada), para encontrar respuestas a los problemas planteados. 

Con Big Data, lógicamente, existe mucha más exigencia a nivel tecnológico. Responder a esas necesidades requiere, entre otras exigencias, recurrir a técnicas avanzadas que logren la necesaria integración de los datos a la hora de hacer consultas. 

La funcionalidad de las soluciones de data archiving permiten buscar datos muy antiguos de forma eficiente. Facilitan que el usuario haga búsquedas ágiles que le resulten sencillas cuando tenga acceso a esa información gracias a tecnologías que permitan transparentar el dato.

La idoneidad de las soluciones de data archiving para el Big Data facilita su uso para enriquecer el Bussiness Intelligence o cualquier otra necesidad de extracción de valor de los grandes datos con los que trabajamos utilizando Hadoop u otras tecnologías de procesamiento.  

De este modo, agregar el data archiving a un sistema analítico de Big Data enriquece el análisis, sin perjuicio de su uso como solución dentro de una estrategia general de almacenamiento de datos inactivos del sistema productivo.

Si bien no existen productos específicos para un data archiving orientado a Big Data, gracias a sus características y, en particular, a las técnicas avanzadas hoy disponibles, la estrategia de data archiving encaja a la perfección en un sistema analítico de grandes datos.

Básicamente, fortalece sus funcionalidades en lo que respecta a la captura, almacenamiento, análisis y visualización de los datos para, finalmente, convertirlos en información crítica que facilite la toma de decisiones. 

Soluciones de data archiving para Big Data

En el mercado encontramos numerosos softwares de archivados de datos. Según el último estudio de la consultora Gartner, Informatica, IBM, HP y Solix Technologies son los líderes del Magic Quadrant for Structured Data Archiving and Application Retirement.

Informatica, la compañía número uno en soluciones de integración de datos, ocupa por segundo año consecutivo una destacada posición entre ellos. El informe anual de Gartner, publicado en junio de 2015, destaca la "capacidad de ejecución y visión integradora" de Informatica Data Archive como principales ventajas comparativas.

Informatica Data Archive es un software de archivado de datos y particionado que refuerza la seguridad. Su escalabilidad es otro de sus principales rasgos, así como su mejora del rendimiento de las aplicaciones y el crecimiento eficiente de los datos en diferentes aplicaciones. 

IBM InfoSphere Optim se diferencia, siempre según Gartner, por una "ventaja significativa" que le aporta la compresión de archivos y, en general, constituye una solución interesante para entornos de Big Data.

Por su parte, el informe señala la importancia de HP Structured Data Manager para automatizar el archivado de bases de datos y retirar aplicaciones preservando la integridad de los mismos, así como el interés de herramientas como Delphix Live Archive, que ofrece "una imagen virtualizada de toda la pila" para el archivado de aplicaciones. 

La consultora estadounidense también destaca la compatibilidad con muchas aplicaciones y bases de datos de Solix Enterprise Data Management Suite (EDMS). Su plataforma unificada permite organizar y gestionar datos estructurados, semi-estructurados y no estructurados. 

Posts relacionados:

Ebook Data Archiving