El valor de la gestión de datos

Data Lake

Un data lake es un repositorio que contiene una gran cantidad de datos en bruto en su formato nativo. Dichos datos se mantienen allí hasta que se necesitan.

Al contrario que un data warehouse que almacena los datos en archivos o carpetas de forma jerárquica, un data lake utiliza una arquitectura plana para almacenar los datos en bruto. A cada elemento del data lake se le asigna un identificador único y se le etiqueta con un amplio conjunto de metadatos. Cuando alguna cuestión de negocio lo requiere, podemos solicitar los datos relacionados del data lake, y con ese conjunto más pequeño de datos, podemos hacer el análisis que nos permita ayudar a responder preguntas. 

Otra diferencia con el data warehouse es que el data lake se distribuye a través de múltiples nodos que pueden estar en la nube en lugar de permanecer en un entorno fijo y estructurado basado en esquemas. Por lo general, en un data warehouse tienes profesionales de IT creando los que ellos creen que son los mejores modelos de datos, lo cual, al no ser ellos los usuarios de los datos, puede obstaculizar la productividad y el valor de negocio aportado por lo datos. En un data lake, primero puedes explorar y averiguar lo que hay y entonces decidir cuál es el esquema que mejor lo organiza.

Los data lakes se suelen construir mediante Hadoop y permiten ayudar a cosas como la detección de fraude en el sector financiero o la mejora de la experiencia del cliente.

Te aconsejamos descargar nuestra guía gratuita “Data Lake: Superando las limitaciones del Data Warehouse” donde encontrarás información que te ayudará a entender todo lo que necesitas saber para aplicar Data Lake a tu negocio.

 

¿Cómo ayuda un DATA LAKE a un CMO en la estrategia de marketing?

Posted on Tue, Jul 26, 2016

Transformar el Big Data en información útil es un gran reto a la hora de convertir los análisis de datos en una herramienta que realmente mejore la competitividad de las organizaciones. Dentro de ellas, qué duda cabe, el CMO, cuyo rol es esencial en las mismas, puede sacarle un gran partido como responsable de un área clave como es el marketing

Read More

Topics: Data Lake