El valor de la gestión de datos

Data Lake vs Big Data, principales diferencias

Posted on Fri, Aug 17, 2018

Dentro de todos los conceptos que hoy en día conocemos en relación a la informática y las nuevas tecnologías debemos hacer referencia a data lake vs big data, dos términos en concreto que, aunque cuentan con algunas similitudes, se diferencian entre sí de manera notable. Para hacer un buen uso de ellos debemos conocer en profundidad cuáles son sus principales características.

data lake vs big data

Entendiendo cada uno de los conceptos

Antes de explicar con más detalle cuáles son las diferencias entre el Big Data y el Data Lake vamos a ponernos en situación y saber en qué consiste cada uno de estos conceptos. El Big Data es el proceso que se encarga de recabar un gran número de datos que se relacionan con la entidad, pudiendo ser esta información sobre el sector que ocupa la empresa, el público al que se dirige, la competencia que existe o la posición que se tiene en el mercado entre otras cosas. Una vez que el Big Data recopila todos estos datos se pasan a analizarlos de forma exhaustiva. El objetivo es encontrar información de utilidad para el desarrollo del negocio, desechando aquellos datos que no tienen relevancia para el mismo.

Por su lado, el Data Lake es, como su propio nombre indica, un lago de datos. Al igual que ocurre con el Big Data, también se encarga de recopilar toda la información necesaria, pero en este caso no desechan los datos que no son relevantes, simplemente se almacenan todos, ya sean válidos o no para el negocio. En cualquier caso, tanto el Big Data como el Data Lake tienen un principal objetivo: encontrar todas las oportunidades que se dan para que el negocio prospere y evolucione.


Las diferencias más importantes

Aunque el objetivo que tienen ambos conceptos es común, la principal diferencia entre cada uno de ellos es la forma en la cual se utilizan tanto para procesar como para almacenar la información. Para poder procesar la información y luego almacenarla tanto el Big Data como el Data Lake necesitan una gran cantidad de espacio. Pero el primero de ellos no requiere tanto como el segundo, puesto que el Data Lake va creciendo de forma continuada. Así mismo, hay que decir que el Big Data va a necesitar mucha más potencia para poder realizar su tarea de forma adecuada, ya que luego tendrá que hacer una criba con la información que no le interese.

Tanto el Big Data como el Data Like trabajan a corto plazo. Sin embargo, la diferencia entre ambos radica en que el Big Data solo va a tener en cuenta los datos que tienen utilidad en ese preciso instante, mientras que el Data Like almacena todos los datos, ya sean relevantes ahora o no por si pueden ser útiles en un futuro.

Respecto a los procesos que llevan a cabo, el Big Data analiza los datos de forma exhaustiva solo una vez, quedándose con lo necesario para el negocio, mientras que el resto de la información la deja de lado. Por su parte, el Data Lake almacena todos los datos para poder procesarlos siempre que sea necesario.

En definitiva, tanto el Big Data como el Data Lake son conceptos que almacenan información, sin embargo según lo que se necesite en el negocio, debemos escoger un modelo u otro. El soporte que proporcionan, utilizado de manera conveniente, dará la oportunidad para que cualquier empresa pueda dar con patrones y claves que le permiten seguir evolucionando para mantener una progresión positiva. De su correcto aprovechamiento puede depender el destino de la empresa, por lo que siempre hay que elegir adecuadamente y sacar el máximo partido tanto al Data Lake como al Big Data.

 

New Call-to-action

Topics: Big Data