Metodología en la calidad de datos: nexo entre tecnología y know-how

Escrito por Redacción PowerData | 18/06/14 17:00

La metodología es el nexo de unión entre tecnología y know-how. Sin un método preciso y claro de mejora continua para realizar el proyecto, estamos abonados a eternizar el mismo y minar las esperanzas del sponsor.

Verdaderamente, uno de los aspectos clave para tener éxito en los proyectos de calidad es encontrar una metodología que se adapte al tipo de proyecto. Y no todas las metodologías lo hacen. Las que mejor encajan en este tipo de proyectos son las metodologías “lean”, como six-sigma o velocity.

A su vez, debe tratarse de una metodología de mejora continua que permita optimizar en cada iteración.

Cuáles deberían ser los aspectos principales?

Realizar un perfilado de los datos candidatos a entrar en el proyecto
Analizar los resultados
Establecer KPI’s y SLA’s
Desarrollar reglas de negocio acorde a los resultados obtenidos
Medir
Comparar

Al mismo tiempo, los SLA’s deben ser básicos al comienzo, medios durante el proyecto y altos una vez el proyecto está consolidado y el plan de calidad está en productivo.

DQ como servicio

Una meta para cualquier usuario debería ser la calidad de datos como un servicio, donde las técnicas de DQ esté́n disponibles como servicios que se puedan llamar desde una amplia gama de herramientas, aplicaciones, bases de datos, y procesos de negocio.

Los beneficios serían los siguientes:

Mayor interoperabilidad

La verdad es que, a la la tradicional APIs, ODBC y JDBC, se pueden complementar con los servicios Web y arquitectura orientada a servicios (SOA ) en soluciones DQ.

Nuevas arquitecturas de aplicaciones

Los servicios DQ se pueden incrustar en cualquier aplicación y permiten ejecutar en tiempo real, a demanda, o por lotes.

Reutilización y consistencia

Generalizando, cualquier técnica de calidad de datos puede convertirse en un servicio de DQ. Las reglas de negocio, validaciones, estandarizaciones, etc, pueden volver a ser usados en otros proyectos. Y su reutilización, adicional al ahorro de costes, fomenta una mayor coherencia en los datos.

Métricas

Las métricas acerca de la calidad de los datos tienen mucho que ver con sus atributos. Un proyecto de calidad de datos debería medir:

Precisión

Exactitud general de los datos en un conjunto. Se determina comparando el conjunto de datos con una fuente de referencia fiable.

Completitud

Se trata de los datos que faltan, es decir, los campos en el conjunto de datos que se han quedado vacíos o cuyos valores predeterminados se han quedado sin cambios.

Conformidad

Valores de datos de un tipo similar introducidos de una manera confusa o inutilizables, por ejemplo, números de teléfono que incluyen / omiten los códigos de área.

Consistencia

Tipos diferentes de registros de datos en un conjunto de datos, como la combinación de la información personal y de negocios.

Integridad

Tiene que ver con el reconocimiento de asociaciones significativas entre los registros de un conjunto de datos.

Duplicidad

Datos que duplican entre sí la información, y que habitualmente comporta el desconocer cuál es el más actualizado.

Post relacionados:

Ver post completo