El valor de la gestión de datos

El Ciclo de Vida en la Calidad de los Datos

Posted on Wed, Feb 26, 2014

Es importante considerar que los proyectos de calidad de datos, son proyectos de mejora continua. Por ello, para obtener los mejores resultados en la implementación de estos proyectos, es imperativa la utilización de procedimientos claros y bien establecidos.

Se identifican 6 procesos o tareas claves que deben reflejarse y abordarse en cada proyecto de data quality.

calidad de datos

FotoCuisinette

¿Cuáles son los seis procesos clave en proyectos de calidad de datos?

1.Descubrimiento. El primer paso hacia la calidad de datos.

Se utiliza para explorar los modelos y/o fuentes de datos indocumentados, logrando de esta manera una rápida identificación y medición de estos. El descubrimiento es un proceso iterativo que no requiere una amplia creación de modelos iniciales, aunque sí las habilidades necesarias para comprender las relaciones entre la información. Las capacidades analíticas son otro requisito en esta etapa de cualquier iniciativa de calidad de datos, ya que, por lo general, se divide en tres categorías:

  • Preparación de datos
  • Análisis de datos
  • Analítica avanzada

 

2.Perfilado. Una etapa que no hay que olvidar en iniciativas de data quality

El data matching o perfilado es una auditoría de Calidad de Datos con la entrega de un cuadro de mando que identifica, clasifica y cuantifica los problemas de calidad dentro de todas las fuentes.

El objetivo de la auditoría es generar una medida tangible de la calidad de los datos al inicio, que permitirá aclarar las condiciones actuales de la información, aportando visibilidad sobre aspectos tan relevantes como la existencia de duplicidades o redundancias en los datos.

 

3.Limpieza. Un proceso clave para asegurar la calidad de datos

La limpieza de datos es el proceso de detectar y rectificar datos inexactos o corruptos de una base de datos. El proceso se usa principalmente en bases de datos donde se modifican, reemplazan o eliminan datos incorrectos, incompletos, inexactos o irrelevantes.

Mediante este proceso clave para la calidad de datos se definen las reglas y se establecen metas a alcanzar. En función del nivel de calidad de datos de los activos informacionales de la organización, de los objetivos de negocio y de la rentabilidad de una iniciativa de este tipo, se determinará cuál es el nivel de calidad de datos que hay que trabajar por alcanzar y mantener.

 

 Accede GRATIS al Webinar sobre calidad de datos en el mundo Big Data

 

4.Estandarización

La estandarización de datos es el proceso de transformar a un formato consistente los datos procedentes de sistemas dispares, con formatos diferentes y a los que se aplica distintas reglas.

Las diferencias originales, por pequeñas que sean, pueden dar lugar a malentendidos e interpretaciones erróneas de los datos de la organización, generando desconfianza en los sistemas de información de la empresa y restando agilidad a los procesos, que requerirían de múltiples comprobaciones.

Con la estandarización, al transformarse los datos a un formato consistente, es posible deshacerse de las anomalías y valores atípicos, aportando coherencia, un aspecto esencial para la calidad de datos.

 ciclo de vida calidad datos

5.Consolidación. La mejora efectiva

La consolidación hace posible reunir en un data warehouse a las entidades y atributos de la información, sin que se alteren las características técnicas ni el formato original de las fuentes de datos.

En esta etapa se implementan los procesos de mejora en la calidad de los datos en base a reglas de consolidación. El resultado es una visión única, garantía de calidad de datos en toda la organización.

 

6.Monitorización. La continuación del ciclo de calidad de datos

Una vez que el proceso de calidad de datos se ha implementado, es importante que se informe sobre los resultados. La monitorización no comprende sólo las acciones de seguimiento y las mediciones, sino también la presentación de informes para la distribución de los resultados, incluyendo desglose y alertas.

¿Lleváis a cabo los 6 procesos clave de un proyecto de calidad de datos en tu organización?

 

New Call-to-action

Topics: Data Quality