El valor de la gestión de datos

Datos primarios y secundarios para explicar big data y data exhaust

Publicado el 12/02/17 23:00

Big data es ya bastante conocido por muchas empresas mientras que data exhaust lo es bastante menos. Big data son datos primarios relacionados con el core de tu negocio mientras que data exhaust son datos secundarios que se van creando día a día. Datos primarios y secundarios nos van a servir hoy para explicar un poco de big data y data exhaust.

datos primarios y secundarios.jpg

Para ver las diferencias entre Big Data y data exhaust basándonos en datos primarios y secundarios vamos a ver 5 cosas que es necesario comprender del data exhaust para entender los pros y los contras de este tipo de datos.

 

1. Es esencialmente todo el Big Data que no pertenece al core de tu negocio

El término data exhaust se lleva utilizando desde hace más de una década, y surgió a raíz de los nuevos flujos de datos procedentes de los smartphones. Hoy en día, las herramientas de datos más accesibles están trayendo el data exhaust al primer plano.

Datos primarios y secundarios tienen mucho que ver en esto. Si big data son datos primarios que se relacionan con la función principal de tu negocio, data exhaust son datos secundarios, o lo que es lo mismo, todo lo demás que se ha creado a lo largo del camino. Por ejemplo, un banco consideraría primarios todos los datos sobre débitos y créditos de las cuentas de sus clientes. Los datos secundarios pueden incluir información como porcentaje de transacciones de los clientes que se realizan en cajeros automáticos en lugar de una sucursal física.

No hay definiciones o esquemas estándar para data exhaust, el cual tiende a ser bruto y desestructurado, pero en muchos sentidos, es equivalente a los subproductos asociados con las máquinas de una empresa y al core de las actividades online. Puede incluir flujos procedentes de navegadores web, plugins, archivos log, dispositivos del Internet de las Cosas, y más.

 

2. Normalmente es más grande que el Big Data

El término Big Data es en sí mismo un término relativo que se reduce esencialmente a cualquier cosa que sea tan grande que no se pueda inspeccionar manualmente o trabajar con ella de registro en registro. En general, data exhaust tiende a ser aún mayor, principalmente porque hay pocos límites en lo que una empresa puede recoger.

Para entender esto mejor, podemos decir que Google aquí es el líder. Literalmente colecciona todo, incluso antes de que sepan que van a hacer con él.

Eso trae a colación otra característica interesante del data exhaust relacionada con datos primarios y secundarios: los datos secundarios del data exhaust pueden convertirse en datos primarios una vez que se encuentra un uso para ellos.

 

3. Tiene un gran potencial

Data exhaust puede ser enormemente útil. En el ejemplo bancario, saber donde los consumidores realizan la mayoría de sus transacciones puede llevar al banco a hacer un mejor trabajo.

No es fundamental para la transacción pero puede ser importante para elevar el servicio a los clientes a un mejor nivel. Proporciona un nivel de comprensión y contextualización a esta transacción o servicio primario que cada vez más desean los clientes.

Data exhaust puede contener elementos importantes de información que quizá no estés buscando hoy, pero que podrían resultar útiles en el futuro.

 

4. Puede haber riesgos asociados en el Data Exhaust

Se trata generalmente de cosas que los clientes pueden no estar dispuestos a darte. Por lo tanto, existen potenciales riesgos legales, de marketing y de relaciones públicas, en torno al aprovechamiento de esos datos, y podrían acabar alejando a tu base de datos de clientes o socios, cuando sepan que sabes cosas sobre ellos que no querían que supieras.

Las implicaciones pueden ser sutiles. Si una compañía de seguros que utiliza GPS para localizar tu coche en caso de robo, hiciera uso del hecho de que puede ver la ubicación GPS de todas las partes en las que has estacionado recientemente tu coche, por ejemplo, podría aumentar las tarifas para los clientes que habitualmente estacionan en zonas de mayor delito. Sin la intención de hacerlo directamente, podría construir un algoritmo que termine discriminando racionalmente.

Otro riesgo potencial es guardar datos datos primarios y secundario que nunca serán útiles.

Los CIOs necesitan equilibrar el valor del data exhaust con el desperdicio que supone mantener toneladas de datos inútiles para siempre. Pero eso es muy difícil de hacer ahora mismo.

 

5. Tienes que tomar algunas decisiones

La conclusión es que es crítico ser selectivo acerca de qué data exhaust se guarda.

Es importante comenzar a tomar algunas decisiones sobre lo que se va a tirar. Por ejemplo, cuando se trata de smartphones y otros dispositivos, es bien sabido que gran parte de los datos son datos asociados a la transmisión, que es dudoso que sean útiles.

Además, se debe acercar a los empleados al core del negocio, en contacto con los datos. Es posible que ellos tengan preguntas inmediatas que demuestren la relevancia de algunos datos de inmediato.

Desde una perspectiva técnica, en las empresas necesitan tecnologías de almacenamiento escalables, así como herramientas para el acceso de datos. Una de las piezas más difíciles de trabajar con el data exhaust es la de conseguir una visión coherente y única alrededor de ellos. Limpiar y unificar esos datos puede ser un desafío.

Con los datos primarios y secundarios las empresas no suelen preocuparse en el momento de su recolección, pero es importante que al menos a los datos secundarios se les haga una limpieza. Es importante darse cuenta de que no es sólo una cuestión de decir “aquí está todo este montón de datos”. Necesitamos hacer algo con ellos.

 

New Call-to-action

Temas: Data Governance