Un sistema de gestión de datos de Big Data es un término genérico que tiene que ver con lo que muchas organizaciones necesitan para administrar sus negocios en esta nueva era de Big Data.
Nos referimos a lo siguiente. Cuando las tecnologías Hadoop y NoSQL empezaron a ser populares, algunos de sus primeros seguidores hablaban de ellas como los reemplazos de las bases de datos relacionales. Más recientemente, sin embargo, se ha visto que pueden ser herramientas complementarias.
Para maximizar el valor de Big Data es ideal tener Hadoop y noSQL, pero también es posible mantener algunas partes con sistemas de bases de datos relacionales, siempre que exista una buena integración. Partidarios de Hadoop e incluso grandes empresas, analistas y proveedores, están de acuerdo en que, pese a que las bases de datos relacionales no sean ideales para manejar grandes cantidades de datos, tener todas estos elementos trabajando juntos es lo ideal. Así que, cuando todos estos componentes marchan al unísono, ¿qué es lo que tienes?
La respuesta es simple. Tienes un sistema de gestión de datos de Big Data.
Hemos pasado de gestionar datos, a gestionar Big Data y de un sistema de gestión de base de datos relacional, a un sistema de gestión de datos de Big Data que integra Hadoop, noSQL y tu datawarehouse relacional. Incluso posiblemente otras fuentes de datos.
Pero, ¿sabemos qué es cada una de estas tecnologías de base de datos y cuál es su importancia concreta en este contexto?
Dentro de una infraestructura informacional, como puede ser un sistema de gestión de datos, conviven distintas tecnologías. Conocerlas permite contextualizar mejor el funcionamiento y capacidades de uno de los recursos más importantes con los que cuenta el negocio hoy día. Se trata de las siguientes:
Tal vez te interese leer:
Tipos de implementación de Big Data
Esto se consigue dado su carácter distribuido, que permite que múltiples nodos de procesamiento y, en ocasiones, también diferentes servidores, almacenen los datos no estructurados. La escalabilidad horizontal es el atributo que marca la diferencia principal con las RDBMS.
Seguramente ahora ves las necesidades de procesamiento de grandes datos de forma distinta. Ganando en comprensión sobre el funcionamiento de un sistema de gestión de datos se puede optimizar la inversión en tecnología y escoger los software y herramientas más adecuados para alcanzar objetivos.