El valor de la gestión de datos

¿Qué es el data mining y cómo puede ayudar a crear valor empresarial?

Posted on Thu, Feb 23, 2017

Para saber lo que es el data mining es importante conocer que con esto las organizaciones son capaces de encontrar y seleccionar la información más importante y relevante. Esta información se puede utilizar para crear modelos que pueden ayudar a hacer predicciones acerca de cómo las personas o sistemas se van a comportar, para así poder anticiparse.

que es el data mining.jpg

¿Qué es el data mining?

Data mining es el proceso de analizar datos desde diferentes perspectivas para convertirlos en información útil que se puede utilizar para, por ejemplo, aumentar ingresos, recortar costes, etc.

El data mining ordena los datos para intentar identificar patrones y establecer relaciones.

Las técnicas de data mining se utilizan en muchos áreas de investigación, incluyendo las matemáticas, la cibernética, la genética y el marketing. Existe un tipo de data mining llamado web meaning que se utiliza en la gestión de relaciones con los clientes (CRM) y que aprovecha la gran cantidad de información que se recopila en un sitio web para encontrar patrones en el comportamiento de los usuarios.

 

¿Cómo puede el data mining ayudar a crear valor de negocio?

Hay muchos tipos diferentes de análisis que se pueden hacer para obtener información del Big Data. Cada tipo de análisis tendrá un impacto o resultado diferente. Qué tipo de técnica de data mining deberías utilizar depende realmente del tipo de problema de negocio que estás intentando resolver.

Diferentes análisis obtendrán diferentes resultados y por lo tanto proporcionarán diferentes ideas.

El data mining se refiere especialmente al descubrimiento de patrones interesantes y desconocidos anteriormente, registros inusuales o dependencias. Al desarrollar una estrategia de Big Data, es importante tener una clara comprensión de lo que es data mining y cómo puede ayudarte.

 

Anomalía o detección de valores atípicos

La detección de anomalías se refiere a la búsqueda de datos en un conjunto de datos que no coinciden con un patrón proyectado o un comportamiento esperado.

A las anomalías también se les llaman outliers, excepciones, sorpresas o contaminantes y a menudo proporcionan información crítica y accionable.

Una anomalía es un objeto que se desvía significativamente del promedio general dentro de un conjunto de datos o una combinación de datos. Está distante numéricamente del resto de los datos y por lo tanto el valor atípico indica que algo está fuera de lo común y requiere un análisis adicional.

Valor de negocio: La detección de anomalías se utiliza para detectar fraudes o riesgos dentro de los sistemas críticos y tiene todas las características que pueden ser de interés para un analista, el cual puede analizar estas anomalías para descubrir lo que realmente está pasando. Puede ayudar a encontrar eventos extraordinarios que podrían indicar acciones fraudulentas, procedimientos defectuosos o áreas donde una teoría determinada es inválida. Es importante tener en cuenta que en grandes conjuntos de datos, una pequeña cantidad de anomalías es común. Las anomalías pueden indicar datos erróneos pero también pueden deberse a una variación aleatoria o pueden indicar algo científicamente interesante. En todos los casos se requiere investigación adicional.

 

Aprendizaje de reglas de asociación

El aprendizaje de reglas de asociación permite el descubrimiento de relaciones interesantes (interdependencias) entre diferentes variables en bases de datos grandes. El aprendizaje de reglas de asociación descubre patrones ocultos en los datos que pueden utilizarse para identificar variables dentro de los datos y las co-ocurrencias de diferentes variables que aparecen con mayores frecuencias.

Valor de negocio: El aprendizaje de reglas de asociación se utiliza a menudo en la industria minorista para encontrar patrones en los datos de los puntos de venta. Estos patrones se pueden utilizar al recomendar nuevos productos desde otros basado en lo que otros clientes han comprado antes, o sobre qué productos se compran juntos. Si esto se hace correctamente puede ayudar a las organizaciones aumentar su tasa de conversión.

 

Análisis por agrupación

Análisis por agrupación es el proceso de identificación de conjuntos de datos que son similares entre sí para entender las diferencias, así como las similitudes, dentro de los datos. Las agrupaciones tienen ciertos rasgos en común que pueden usarse para mejorar los algoritmos. Por ejemplo, a las agrupaciones de clientes con comportamientos de compras similares se les pueden ofrecer productos y servicios similares para aumentar la tasa de conversión.

Valor de negocio: Un resultado de un análisis de agrupación puede ser la creación de “personas”. “Personas” son personajes ficticios creados para representar los diferentes tipos de usuarios dentro de un grupo demográfico, actitud y comportamiento, de forma que pueden utilizar un sitio web, una marca o un producto de manera similar. El lenguaje de programación R tiene una gran variedad de funciones para realizar análisis de agrupaciones de forma relevante y por lo tanto es especialmente interesante para realizar análisis de agrupación.

 

Análisis de regresión

El análisis de regresión trata de definir la dependencia entre variables. Asume un efecto causal unidireccional de una variable a la respuesta de otra variable. Variables independientes pueden verse afectadas entre sí pero no significa que esta dependencia sea en ambos sentidos, como si es el caso del análisis de correlación. Un análisis de regresión puede demostrar que una variable depende de otra pero no viceversa.

Valor de negocio: El análisis de regresión se utiliza para determinar los diferentes niveles de satisfacción de los clientes y cómo afectan a su lealtad. Cómo los niveles de servicio pueden verse afectados por cosas como por ejemplo el clima.

 

Conclusión

El data mining puede ayudar a las organizaciones a encontrar la información más importante y relevante. Esta información se puede utilizar para crear modelos que pueden ayudar a hacer predicciones de cómo las personas o sistemas se computarán para que se puedan anticipar a él. Cuantos más datos tengas, mejores serán los modelos que podrás crear utilizando las técnicas de data mining, lo que resultará en más valor de negocio para tu organización.

 

New Call-to-action

Topics: Data Quality