El valor de la gestión de datos

La limpieza de datos no basta para preservar la calidad de la información

Publicado el 1/04/16 21:00

La limpieza de datos, por sí misma, no garantiza la inmunidad a los errores, las deficiencias y los fallos en la calidad de la información. Todavía hay empresas que desconocen la importancia de llevar a cabo un adecuado mantenimiento de sus datos. Y es precisamente este programa de data maintenance el que da soporte a las acciones de limpieza. Se trata de dos enfoques complementarios con un mismo objetivo: preservar la calidad del dato y asegurar su consistencia, completitud, actualización y exactitud.

limpieza_de_datos_y_mantenimiento.jpg

Créditos fotográficos: istock valio84sl

 

Mantenimiento y limpieza de datos: aliados para mejorar la calidad de la información

De la misma forma que en las instalaciones y oficinas de cualquier negocio se limpia a diario, la limpieza de datos debe formar parte del plan de la empresa para asegurarla calidad de la información. Estas acciones son puntuales y, preferiblemente, deben ser llevadas a cabo por expertos con las mejores tecnologías.

La aplicación de, por ejemplo, un de software de calidad de datos, ofrece la oportunidad de detectar y corregir los errores que se han acumulado con el tiempo. El uso de técnicas sofisticadas y procesos automatizados pueden identificar los posibles duplicados, a la vez que encuentran todos los datos que no cumplen con las reglas.

Una limpieza de datos suele consistir en tres acciones:

  • Prevención de errores: ocupa el 10% del esfuerzo de limpieza.
  • Detección de fallos: suele suponer el 30% de la acción.
  • Reparación de todas las irregularidades identificadas: requiere del 60% de los recursos y el tiempo destinado a la acción de limpieza de datos.

No obstante, si la limpieza se queda en una acción aislada su efectividad terminaría siendo nula. La limpieza de datos es el proceso de hacer frente a los errores dentro de la base de datos, asegurando que las anomalías se localizan de forma retrospectiva y procediendo a eliminar todos los errores identificados automáticamente y de una sola vez.

Para prolongar su efecto positivo en el tiempo se requiere de un buen mantenimiento. Éste se ocupa de la corrección y verificación permanentes, así como de llevar a cabo controles periódicos que permitan conocer el estado de la calidad. Se trata del proceso que envuelve a la calidad de datos en un ciclo de mejora continua. Aunque no existen reglas para su estructuración, suele ser aconsejable que el plan de mantenimiento de datos se distribuya de la siguiente forma:

  • Prevención de fallos: 45%
  • Detección de errores: 30%
  • Reparación de irregularidades: 25%

Trabajando de esta forma se evita que los problemas en la calidad de los datos escalen hasta llegar a un nivel insostenible, de difícil solución.

El mantenimiento y las actualizaciones no son más importantes que la limpieza de datos. Tampoco es ésta prioritaria ya que, a largo plazo, la organización necesita de ambas para garantizar que se cumple con los estándares de la información y que los datos que se usan para el análisis y la toma de decisiones son completos y consistentes. Para apoyar las iniciativas de limpieza y mantenimiento, la organización necesita fomentar una cultura de calidad de datos, donde todos los usuarios y personal que interactúe de alguna forma con la información, sean conscientes de la importancia de observar ciertas reglas que garanticen el mejor uso.

 

New Call-to-action

Temas: Data Quality