El valor de la gestión de datos

¿Es Hadoop la mejor tecnología para sacarle partido al Big Data?

Posted on Tue, Sep 23, 2014

Bid Data Hadoop

La consultora Gartner define Big Data como aquellos "recursos de información de alto volumen y alta velocidad y/o de gran variedad que requieren nuevas formas de procesamiento para permitir una mejor toma de decisiones, nuevos descubrimientos y optimización de procesos".

En este contexto, el sentido y valor de Hadoop cobra todo su significado. Porque Hadoop es, sin ir más lejos, la tecnología estrella, la clave para dar valor a esa ingente cantidad y variedad de datos. El método, en suma, que hace posible el aprovechamiento del Big Data, siempre que se sepa utilizar, ya que se trata de una simple herramienta que, eso sí, abre un sinfín de posibilidades que nos permite apuntar a las estrellas. 

A la hora de establecer objetivos, en efecto, podemos llegar tan lejos como queramos. Alcanzarlos o no es otra cuestión, pero en todo caso, una cosa hay cierta: de no existir Hadoop ni siquiera podríamos llegar a plantearlos como algo factible, es decir, realizable con costes y en unos plazos que fuesen mínimamente razonables.

Hadoop, la llave de Big Data

Hadoop conserva su núcleo en función del paradigma de programación creado por Google, si bien ha florecido a su alrededor un rico ecosistema. Así, en torno a su versión opensource, capaz de procesar grandes cantidades de datos, se ha ido diseñando y rediseñando el camino al valor de Big Data desde aquella primera distribución opensource de uso libre bautizada como Apache Hadoop, cuya enorme popularidad ha multiplicado los productos comerciales basados en ella.

Además, de forma constante, la comunidad internacional opensource va manteniendo y actualizando Hadoop, corrigiendo errores y agregando estos nuevos paquetes para brindar nuevas funcionalidades que se adapten a los requerimientos de las corporaciones. 

¿Pero, qué hace diferente a Hadoop? Básicamente, ser capaz de almacenar toda clase de datos, estructurados, no estructurados o semiestructurados gracias a una arquitectura escalable, tolerante a fallos, con capacidad de asegurar una alta disponibilidad y recuperación de los datos. Y, sobre todo, con Hadoop es posible dar valor a los datos que las empresas ya guardaban, y que no analizaban porque, entre otras cosas, el coste era desmedido.

Así es, con Hadoop se abarata muchísimo el análisis y extracción de valor mediante un ahorro sustancial en harware, en software y en servicios. No sólo porque es opensource y está pensado para correr en hardware barato como puede ser Linux, con lo que las empresas ven abrirse ante sí un gran abanico de posibilidades que posibilitan obtener valor de datos con los que no estaban trabajando. Ahora, Hadoop mediante, el mayor o menor provecho sólo depende de la habilidad para extraerlo.

Que Hadoop sea o no la mejor tecnología para sacar partido a los grandes datos es una cuestión subjetiva. Encabece o no el ranking, sin embargo, sí puede afirmarse que constituye la tecnología más importante para hacer posible el objetivo de sumar valor al negocio a bajo costo, ya que podemos crear un cluster Hadoop con un presupuesto mínimo.

Frente a otras herramientas como Exadata o Teradata, que requieren inversiones millonarias para implementar análisis, Hadoop ofrece eficiencia. Esta es su ventaja competitiva, su característica distintiva, la razón de su popularidad y de que represente todo un mundo de posibilidades.

¿Existiría Big Data sin Hadoop?

Considerando que ciertos análisis no pueden implementarse sin Hadoop, en muchas ocasiones por obvias razones de presupuesto, cabría preguntarse si Big Data existiría sin el desarrollo de esta tecnología. Y la respuesta es clara:  al margen de cómo pudiéramos manejar ese océano de datos que es Big Data, su crecimiento imparable es independiente de cualquier forma de tratarla.

Un digno sustituto de Hadoop, por otra parte, debería ofrecer un costo y tiempo razonables. Actualmente, en el cumplimiento de ambos requisitos Hadoop no tiene competencia. Sin más alternativa, por lo tanto, habría que inventar otra tecnología, ...y entre tanto, Big Data seguiría a lo suyo, inmutable, multiplicándose exponencialmente en sus diferentes y variopintas variedades de datos. O, lo que es lo mismo, si Hadoop no existiese, muy probablemente no nos quedaría otra que inventarlo.

Fuente imagen: rajcreationzs / FreeDigitalPhotos.net

 

Post relacionados:

 

BIG DATA LAS CUATRO GRANDES EMPRESAS

Topics: Big Data