El valor de la gestión de datos

Metodología en la calidad de datos: nexo entre tecnología y know-how

Publicado el 18/06/14 14:00

Captura de pantalla 2014 03 24 a la(s) 16.15.23

La metodología es el nexo de unión entre tecnología y know-how. Sin un método preciso y claro de mejora continua para realizar el proyecto, estamos abonados a eternizar el mismo y minar las esperanzas del sponsor.

Verdaderamente, uno de los aspectos clave para tener éxito en los proyectos de calidad es encontrar una metodología que se adapte al tipo de proyecto. Y no todas las metodologías lo hacen. Las que mejor encajan en este tipo de proyectos son las metodologías “lean”, como six-sigma o velocity.

A su vez, debe tratarse de una metodología de mejora continua que permita optimizar en cada iteración.

Cuáles deberían ser los aspectos principales?

  • Realizar un perfilado de los datos candidatos a entrar en el proyecto

  • Analizar los resultados

  • Establecer KPI’s y SLA’s

  • Desarrollar reglas de negocio acorde a los resultados obtenidos

  • Medir

  • Comparar

Al mismo tiempo, los SLA’s deben ser básicos al comienzo, medios durante el proyecto y altos una vez el proyecto está consolidado y el plan de calidad está en productivo.

 

picha aquí para descargarte una guía más completa sobre calidad de datos.

 

DQ como servicio

Una meta para cualquier usuario debería ser la calidad de datos como un servicio, donde las técnicas de DQ esté́n disponibles como servicios que se puedan llamar desde una amplia gama de herramientas, aplicaciones, bases de datos, y procesos de negocio.

Los beneficios serían los siguientes:

Mayor interoperabilidad

La verdad es que, a la la tradicional APIs, ODBC y JDBC, se pueden complementar con los servicios Web y arquitectura orientada a servicios (SOA ) en soluciones DQ.

Nuevas arquitecturas de aplicaciones

Los servicios DQ se pueden incrustar en cualquier aplicación y permiten ejecutar en tiempo real, a demanda, o por lotes.

Reutilización y consistencia

Generalizando, cualquier técnica de calidad de datos puede convertirse en un servicio de DQ. Las reglas de negocio, validaciones, estandarizaciones, etc, pueden volver a ser usados en otros proyectos. Y su reutilización, adicional al ahorro de costes, fomenta una mayor coherencia en los datos.

Métricas

Las métricas acerca de la calidad de los datos tienen mucho que ver con sus atributos. Un proyecto de calidad de datos debería medir:

Precisión

Exactitud general de los datos en un conjunto. Se determina comparando el conjunto de datos con una fuente de referencia fiable.

Completitud

Se trata de los datos que faltan, es decir, los campos en el conjunto de datos que se han quedado vacíos o cuyos valores predeterminados se han quedado sin cambios.

Conformidad

Valores de datos de un tipo similar introducidos de una manera confusa o inutilizables, por ejemplo, números de teléfono que incluyen / omiten los códigos de área.

Consistencia

Tipos diferentes de registros de datos en un conjunto de datos, como la combinación de la información personal y de negocios.

Integridad

Tiene que ver con el reconocimiento de asociaciones significativas entre los registros de un conjunto de datos.

Duplicidad

Datos que duplican entre sí la información, y que habitualmente comporta el desconocer cuál es el más actualizado.

 

Post relacionados:

 

calidad de datos imprescindibles factores


Temas: Data Quality