El valor de la gestión de datos

Mejores prácticas en validación de datos

Publicado el 1/09/16 21:00

Al hablar de calidad de la información es frecuente que aparezcan términos como la verificación y la validación de datos. Ambos métodos contribuyen a aumentar la fiabilidad de cada bit de información disponible, y la aplicación de los dos conjuntos de técnicas es necesaria aunque, la validación de datos  suele resultar un poco más compleja.

validacion_de_datos.jpg

 Créditos fotográficos: istock iSergey

Por qué la validación de datos no es tan sencilla como la verificación

En primer lugar, el motivo fundamental por el que se da esta diferencia es el hecho de que una verificación puede llevarse a cabo sobre los datos contenidos en una base de datos sin necesidad de tener que recurrir a ningún otro elemento. La única excepción se daría en los casos en que no se incluyeran especificaciones de metadatos o reglas de negocio.

Sin embargo, la validación de datos requiere necesariamente referencias procedentes del exterior del database. Y, aquí entra en juego otro de los aspectos que añaden ese nivel extra de complejidad a un proceso de este tipo, ya que en este cotejo de la información con la que se obtiene de fuentes externas, se necesita evaluar los datos en base a:

  • Criterios objetivos: que responden a la pregunta sobre si un elemento de datos representa correctamente ese aspecto del mundo real que se destina al modelo.
  • Criterios subjetivos: son los que se emplean para llevar a cabo la evaluación de la idoneidad de los datos para un propósito determinado.

Esto significa que, no sólo habrá que saber escoger la herramienta correcta para la realización del proceso de validación de datos, sino que también será preciso poder contar con los perfiles que puedan contribuir al resultado final aportando más valor, que no son otros que:

  • Los usuarios de la información: cuya aportación será de gran utilidad en todo caso, especialmente en la validación de los datos en todos los aspectos relativos a la vertiente subjetiva de la validación.
  • Los propietarios de los datos: a los que se puede recurrir cuando se cuente con criterios de valoración objetiva específicos.

 

Mejores prácticas para la validación de datos

En la práctica, a la hora de poner en marcha un proceso de validación de datos es conveniente observar las siguientes recomendaciones:

  • Emplear un proceso de medición idéntico al original para validar una medida no garantizar el mismo nivel de precisión y fiabilidad que si se opta por aplicar un método alternativo.
  • Lo mismo sucede con las fuentes, para la validación de datos es necesario contrastar con varias diferentes, y hacerlo como parte de la rutina de validación.
  • El juicio experto debe considerarse como una técnica de validación de último recurso, sobre todo si es la única fuente de validación para un valor de datos.
  • La validación debe plantearse como algo más elaborado que la simple comparación de los valores de datos con otros valores conocidos. Las transformaciones de los datos mismos deben ser validadas para garantizar que el resultado tiene la calidad esperada.

 

Por último, es conveniente registrar suficiente documentación e información sobre el proceso (así como acerca de las herramientas utilizadas y personas implicadas en él) para cubrir las necesidades futuras que puedan surgir.

 

New Call-to-action

Temas: Data Quality