La metodología es el nexo de unión entre tecnología y know-how. Sin un método preciso y claro de mejora continua para realizar el proyecto, estamos abonados a eternizar el mismo y minar las esperanzas del sponsor.
Verdaderamente, uno de los aspectos clave para tener éxito en los proyectos de calidad es encontrar una metodología que se adapte al tipo de proyecto. Y no todas las metodologías lo hacen. Las que mejor encajan en este tipo de proyectos son las metodologías “lean”, como six-sigma o velocity.
A su vez, debe tratarse de una metodología de mejora continua que permita optimizar en cada iteración.
Realizar un perfilado de los datos candidatos a entrar en el proyecto
Analizar los resultados
Establecer KPI’s y SLA’s
Desarrollar reglas de negocio acorde a los resultados obtenidos
Medir
Comparar
Al mismo tiempo, los SLA’s deben ser básicos al comienzo, medios durante el proyecto y altos una vez el proyecto está consolidado y el plan de calidad está en productivo.
Una meta para cualquier usuario debería ser la calidad de datos como un servicio, donde las técnicas de DQ esté́n disponibles como servicios que se puedan llamar desde una amplia gama de herramientas, aplicaciones, bases de datos, y procesos de negocio.
Los beneficios serían los siguientes:
La verdad es que, a la la tradicional APIs, ODBC y JDBC, se pueden complementar con los servicios Web y arquitectura orientada a servicios (SOA ) en soluciones DQ.
Los servicios DQ se pueden incrustar en cualquier aplicación y permiten ejecutar en tiempo real, a demanda, o por lotes.
Generalizando, cualquier técnica de calidad de datos puede convertirse en un servicio de DQ. Las reglas de negocio, validaciones, estandarizaciones, etc, pueden volver a ser usados en otros proyectos. Y su reutilización, adicional al ahorro de costes, fomenta una mayor coherencia en los datos.
Las métricas acerca de la calidad de los datos tienen mucho que ver con sus atributos. Un proyecto de calidad de datos debería medir:
Exactitud general de los datos en un conjunto. Se determina comparando el conjunto de datos con una fuente de referencia fiable.
Se trata de los datos que faltan, es decir, los campos en el conjunto de datos que se han quedado vacíos o cuyos valores predeterminados se han quedado sin cambios.
Valores de datos de un tipo similar introducidos de una manera confusa o inutilizables, por ejemplo, números de teléfono que incluyen / omiten los códigos de área.
Tipos diferentes de registros de datos en un conjunto de datos, como la combinación de la información personal y de negocios.
Tiene que ver con el reconocimiento de asociaciones significativas entre los registros de un conjunto de datos.
Datos que duplican entre sí la información, y que habitualmente comporta el desconocer cuál es el más actualizado.
Post relacionados:
10 claves para la calidad de los datos en los sistemas informáticos
Los datos pobres cuestan a las empresas británicas pérdidas millonarias