Podemos definir calidad de datos como el grado en que la información se ajusta a su propósito, mientras que la integridad de datos nos habla de su validez física (sin daños en los datos) y lógica (sin errores de procesamiento o entrada).
La integridad de datos se aplica durante todo el ciclo de vida de los datos. En otras palabras, se aplica a aspectos operacionales de los datos tales como procesos, integración e interfaces de usuarios. Por ejemplo, los datos pueden ser correctos para un sistema pero incorrectos para otro debido a errores de integración.
La integridad de datos se logra través del más alto nivel de calidad de datos asegurando que los datos sean precisos, válidos, oportunos y completos. Aunque los términos calidad de datos e integridad de datos se usan a menudo indistintamente, como hemos visto hay una diferencia clara.
Implementar un proceso de mejora de datos en la empresa es de gran utilidad, incluso para las organizaciones que no alcanzan una comprensión clara de los mismos o que carecen de un determinado perfil tecnológico. En Powerdata hemos comprobado, desde nuestra experiencia, que los negocios que buscan garantizar la integridad de datos y se preocupan por su calidad necesitan empaparse de este concepto, para poder exportarlo a todos los niveles de su organigrama.
Los beneficios de una mejora de datos para una empresa son numerosos y frecuentemente difíciles de medir ya que muchos son intangibles. Pero sí que podemos nombrar algunos de los más importantes:
La consecución de objetivos, en concreto del de calidad de datos, requiere de la participación activa, responsable y comprometida de todos quienes intervienen, de una u otra forma, sobre el ciclo de vida del dato. Ya sea porque los generan, porque los consumen, porque los dotan de una estructura... el rol en sí, de forma aislada no tiene un sentido completo, ya que requiere de una concepción conjunta que globalice su relevancia, para optimizar la eficacia de cada actuación individual, minimizando el riesgo.
Los siguientes son un conjunto de roles que pueden participar en una iniciatica de mejora de calidad de datos:
Jefe de datos o Chief Data Officer (CDO): Es el responsable de calidad de datos de la empresa así como de utilizar la información como un activo mediante procesamiento de datos, análisis, data mining y otros. El CDO reporta principalmente al director ejecutivo (CEO) de la empresa.Es importante aclarar, llegados a este punto, que la calidad de datos no sólo se refiere a la ausencia de defectos. Un dato puede ser completo pero puede estar falto de otras cualidades, imprescindibles para su misión; o puede ser confiable pero necesitar de la dirección correcta, que lo encuadre debidamente permitiendo a su usuario sacar rendimiento a su consumo. Por eso, la calidad del dato, tan unida al concepto de integridad, se articula en base a:
La visión única: que los datos deben proporcionar.Todo proceso de mejora de datos requiere de mediciones, ya que sólo de esta forma es posible aspirar a garantizar la calidad de datos. El papel que la integridad juega en un proyecto de este tipo, desde su posición de atributo de la calidad, es indicar que los datos son totalmente coherentes.