El Valor de la Gestión de Datos

Las 6 dimensiones de la calidad de los datos

Escrito por Redacción PowerData | 5/03/14 8:33
 

Para abordar de manera íntegra la problemática en la calidad de datos, debe realizarse un análisis por cada una de las dimensiones de calidad de datos, logrando de esta manera resolver cada una de las dudas existentes en el proceso y mitigando así los riesgos de fracaso en los proyectos de este tipo.

En este sentido, lo importante y prioritario es tener un punto de partida, una métrica que permita identificar el estado actual de los datos. 

Para ello, es básico realizar una auditoría inicial o perfilamiento de los datos, con el objetivo de averiguar en qué estado se encuentran éstos y a partir de ahí, detectar qué se debe corregir y a su vez determinar parámetros de control que ayuden a medir el avance en los procesos de calidad.

Estos parámetros son conocidos como las seis dimensiones de calidad de datos y son consideradas como los puntos clave que debe de cubrir la calidad de los datos para asegurar nuestros procesos de limpieza y calidad.

Cuáles son las seis dimensiones de calidad de datos?

Completitud

En algunos casos, los datos que no están son irrelevantes, pero cuando se vuelven necesarios para un proceso del negocio, éstos se vuelven críticos.

Conformidad

Los datos que están en los campos de la tabla, deben estar en un formato estándar y legible.

Consistencia

Al hacer el cruce de información con los registros, se debe evitar la  información contradictoria.

Precisión / Exactitud

Si los datos no son precisos, estos no pueden ser utilizados. En este sentido, para detectar si estos son precisos, se compara el dato con una fuente de referencia.

Duplicación

Es importante saber si se tiene la misma información en formatos iguales o similares dentro de la tabla.

Integridad

Otra dimensión de calidad importante radica en el hecho de saber si toda la información relevante de un registro está presente de forma que se pueda utilizar.

El entendimiento de estas seis dimensiones es el primer paso para la mejora de la calidad de datos. Ser capaz de identificar y separar los defectos de los datos clasificándolos por estas dimensiones, nos permite aplicar las técnicas adecuadas para mejorar tanto la información como los procesos que crean y manipulan la información.