El Valor de la Gestión de Datos

Data mining pdf: recursos necesarios del big data a la calidad de datos

Escrito por Redacción PowerData | 18/11/16 1:00

¿Buscas un data mining pdf para ampliar tu conocimiento sobre las posibilidades de esta técnica? La minería de datos se ocupa de analizar la información de la organización con el fin de descubrir patrones y crear modelos predictivos que puedan validar nuevas perspectivas de negocio. A diferencia de lo que sucede en el análisis de datos, donde los objetivos de descubrimiento no se conocen o no quedan bien definidos desde el principio, los esfuerzos de extracción de datos suelen estar impulsados por la consciencia de una ausencia específica de información que no puede satisfacerse mediante consultas o informes de datos estándar.


Créditos fotográficos: istock Federico Caputo

Descubrimiento de tendencias, aprovechamiento de oportunidades de negocio alternativas o impulso de la calidad de los datos son algunos de los objetivos de quienes recurren al data mining.

 

Data mining hoy: mucho más que big data

La minería de datos proporciona información que conduce a una mejor comprensión del mercado. Pero, para poder entregar ese conocimiento, se requiere de una combinación de talento (habilidades estadísticas) y software (algoritmos de reconocimiento de patrones que detectan anomalías). Sin embargo, pese a que la explosión big data ha convertido a la minería en un elemento inseparable al análisis, data mining ya existía mucho antes y tiene un amplio camino por recorrer, como muestran muchos data mining pdf que pueden encontrarse en la red.

La aplicación empresarial de la minería de datos es tan variada que permite descubrir ejemplos tan diversos como:

  • Investigación farmacéutica.
  • Modelado de patrones de tráfico de usuarios a una web.
  • Predicción de los comportamientos de los clientes con el fin de optimizar las ventas y las iniciativas de marketing.
  • Evaluación de la calidad de los datos, como se explica en este data mining pdf del MIT.

 

Aplicaciones de minería para mejorar la calidad de datos: descubrimientos en data mining pdf

El aseguramiento de la calidad de datos imprime una diferencia en el curso de acción, que ya no adolece de desviaciones y se orienta con precisión a los objetivos organizacionales. Como se puede comprobar en el data mining pdf citado o en este otro, también publicado por la Universidad de Massachusetts; uno de los principales atributos de la calidad del dato es la completitud. Porque:

¿Qué sucedería si se descubre la ausencia de determinados valores en un conjunto de datos?

¿Cómo podría afectar la ignorancia de este hecho a la estrategia diseñada para su análisis?

¿Y a la contextualización y toma de decisiones a que éste diera lugar?

Para conocer más sobre este tema se puede profundizar en un whitepaper firmado por Ralph Kimball, "Newly emerging best practices for Big Data", que Informatica publica en su web y que, pese a no poder considerarse estrictamente como un data mining pdf, sí que es un recurso muy indicado para quienes quieran conocer esa otra faceta de la minería de datos que la relaciona con la calidad de datos.

De este tópico se habla también en algunos de los recursos que ofrecemos en nuestra web, los ebooks gratuitos "Calidad de Datos: Know How + Tecnología" y  "La calidad de datos: Una radiografía completa". Dos guías que complementan a los data mining pdf presentados, facilitando la comprensión de la importancia de la calidad para los activos informacionales de la organización.