El valor de la gestión de datos

Hadoop Pivotal: qué puede ofrecer

Publicado el 8/10/14 4:00

Los desarrollos tecnológicos clave detrás de Hadoop Pivotal permiten llevar a cabo cargas de datos de alta velocidad, así como realizar consultas SQL de máximo rendimiento a los datos almacenados en HDFS. Esto supone un paso importante hacia el desarrollo de una plataforma Big Data integral que sea capaz de:

  •  Facilitar todo tipo de cargas de trabajo, tanto analíticas como transaccionales; bien por lotes, bien en tiempo real.

  •  Almacenar y procesar todos los datos de una organización: estructurados y no estructurados.

  •  Aportar utilidad, tanto a los data scientists más experimentados, como a los usuarios de negocio.

 

pivotal resized 600

 

Qué ofrece Hadoop Pivotal

Hadoop Pivotal, además de ofrecer los componentes open source más demandados, como MapReduce, HDFS, Flume, Pig, Hive, YARN, Mahout, Sqoop o HBase, también incorpora en su oferta algunos otros como:

  • Command Center: es una robusta herramienta de gestión del cluster que permite a los usuarios instalar, configurar, monitorizar y administrar componentes y servicios de Hadoop a través de una interfaz gráfica con base web.

  • HAWQ: diez años de innovación resultan en este potente optimizador de consultas SQL con funciones de procesador optimizado que permite lanzar consultas analíticas y cargas de trabajo de consulta mixta en entornos distribuidos y paralelos de gran volumen. Entre sus mayores beneficios se encuentra el que consigue que no sea necesario tener una experiencia en Java tan acusada como se requiere en Hadoop para los algoritmos de MapReduce.

  • Spring: que simplifica el desarrollo de aplicaciones big data al proporcionar un modelo de configuración unificada y APIs fáciles de usar para la interacción con HDFS, MapReduce, Pig y Hive, además de con otros proyectos basados en el ecosistema Spring HD.

Descárgate nuestra Guía sobre Big Data

Las principales ventajas de Hadoop Pivotal

1. Dotar a Hadoop de capacidades empresariales y flexibilidad: últimamente proliferan los frameworks de código abierto para Hadoop, que se posiciona como la tecnología preferida por la mayoría para lidiar con la explosión de grandes datos estructurados y no estructurados. Sin embargo, en ocasiones la falta de preparación, de madurez tecnológica o de infraestructura dificultan el aprovechamiento de las posibilidades de Hadoop. Aquí es donde interviene Hadoop Pivotal, que permite obtener rápidamente una visión global y única de big data, al incorporar características que mejoran la adopción y el uso de la plataforma empresarial:

  •  Permitiendo a las empresas un procesamiento y análisis avanzado que hace posible tomar decisiones críticas de negocio sin perder en inmediatez.

  •  Aumentando la productividad de los procesos y proporcionando herramientas de gestión robustas.

  •  Integrándose con proyectos, como Spring, que facilitan el desarrollo de aplicaciones y servicios basados en datos.

2. Acelerar Hadoop con conjuntos de habilidades de SQL existentes: HAWQ consigue acelerar los proyectos de análisis de datos, simplificar las tareas ligadas al desarrollo y aumentar la productividad, ampliando las capacidades de Hadoop y reduciendo los costes. Para ello, Hadoop Pivotal se basa en tres elementos:

  •  La capacidad que HAWQ aporta para lanzar consultas a Hadoop más rápido que cualquier interfaz de este tipo.

  •  La mejora del rendimiento que se consigue gracias al hecho de que HAWQ aprovecha los productos existentes de inteligencia de negocios, analítica avanzada y habilidades de SQL de la fuerza de trabajo.

  •  La compatibilidad con SQL. No sólo HAWQ es compatible al 100% con SQL sino que además es  el motor de consultas SQL más rápido del mundo en Hadoop. 

3. La primera plataforma de la industria para soluciones de análisis de bucle cerrado: mediante la combinación de OLTP y OLAP, y utilizando Hadoop como la capa de almacenamiento común, Gemfire XD permite al negocio tomar decisiones prescriptivas en tiempo real. Esto significa que se puede tomar acción frente a los acontecimientos al tiempo que se producen.

 

Post relacionados:

 

hadoop y el bigdata

Temas: Big Data