El valor de la gestión de datos

¿Existen alternativas a Hadoop?

Posted on Tue, Oct 14, 2014

Hadoop es una plataforma de almacenamiento de datos altamente escalable que se utiliza como base para muchos proyectos de grandes datos, sin embargo, su curva de aprendizaje y algunas otras cuestiones hacen que muchos se planteen alternativas a Hadoop. Pero ¿cuáles son? ¿Realmente merece la pena arriesgarse?

 

Hadoop 1 resized 600

Créditos fotogrñaficos: Paris.butterfield

 

Alternativas a Hadoop

Hadoop lleva tiempo en la cresta de la ola, lo prueban los 3,460.000 resultados Google y, tal y como pronostica Gartner en uno de sus últimos informes, seguirá estándolo al menos durante los próximos ejercicios ya que al menos el 65% de las aplicaciones de analítica avanzada lo incorporarán en 2015.

No sólo eso, según publica PcWorld, una búsqueda con la palabra clave "Hadoop" en una web especializada en ofertas de empleo de TI, revela una cifra superior a las mil propuestas ofertadas solamente en un mes.

Yahoo, Facebook y más de la mitad de las empresas listadas en el prestigioso ranking Fortune 50 usan Hadoop para su interacción con big data. ¿Se equivocan?

Lo cierto es que, para empezar, no existen demasiadas alternativas a Hadoop. Hydra o CoSort son algunas de las que más suenan y lo cierto es que, puede ser a causa de su reciente aparición, o tratarse de sus limitaciones, pero son pocos los negocios que deciden tomar otros caminos lejos de Hadoop.

 

Descárgate nuestra Guía sobre Big Data

 

Soluciones intermedias: la otra forma de encontrar alternativas a Hadoop

Puede ser debido a su resistencia a fallos, a su eficacia probada, a su experiencia, a sus posibilidades, puede ser porque es la opción más conocida, pero lo cierto es que no es sencillo reemplazar a Hadoop. Para quienes no quieren oír hablar de alternativas Hadoop, pero sí buscan mejorar alguna de sus funcionalidades, están las soluciones intermedias.

El ecosistema de Hadoop se presenta repleto de posibilidades para las empresas que necesitan procesar datos en tiempo real, o buscan un almacenamiento de gran capacidad; también hay soluciones para los negocios que quieren crear nuevas aplicaciones o quieren optimizar su gobernabilidad.

MapReduce, HDFS, Hive, Pig, Flume, Mahout, Storm, Sqoop... son sólo algunas de las opciones que Hadoop propone para multiplicar su eficacia y adaptarse a los requerimientos de cada organización. Pero estas aplicaciones pueden sustituirse por otras, sin tener que olvidarse de Hadoop.

Por ejemplo, en el caso de MapReduce, su lista de competidores es de las más nutridas. Entre ellos se encuentran: Disco, Skynet, Phoenix, Misco, Bashreduce, Qizmt, Riak, Sphere, Octopy, Starfish, MPI-MR, Galago's TupleFlow, HTTPMR, Peregrine, Mincemeat, R3, Elastic Phoenix o Coud MapReduce.

Apostando aún más fuerte llegan las alternativas Hadoop a su componente más nuclear, HDFS. Cassandra, GPFS, Ceph, Cleversafe, Lustre o Islion son algunas de ellas, que llegan buscando mejorar su rendimiento, compararse con su disponibilidad o reinventar sus capacidades de almacenamiento.

Y así, búsqueda tras búsqueda, se puede adivinar que la red está llena de nuevas opciones, algunas con más posibilidades y otras que desaparecen incluso antes de llegar a ser más conocidas. Pero, a pesar de todas estas alternativas, ¿por qué tantos siguen eligiendo Hadoop? La respuesta está en tres de sus cualidades: solidez, innovación y orientación al usuario, que sitúan la plataforma en una posición difícil de alcanzar por cualquiera de sus alternativas.

 

Post relacionados:

 

Enlace a guía gratuita sobre Big Data y Hadoop

Topics: Big Data