Podemos definir calidad de datos como el grado en que la información se ajusta a su propósito, mientras que la integridad de datos nos habla de su validez física (sin daños en los datos) y lógica (sin errores de procesamiento o entrada).
La integridad de datos se aplica durante todo el ciclo de vida de los datos. En otras palabras, se aplica a aspectos operacionales de los datos tales como procesos, integración e interfaces de usuarios. Por ejemplo, los datos pueden ser correctos para un sistema pero incorrectos para otro debido a errores de integración.
La integridad de datos se logra través del más alto nivel de calidad de datos asegurando que los datos sean precisos, válidos, oportunos y completos. Aunque los términos calidad de datos e integridad de datos se usan a menudo indistintamente, como hemos visto hay una diferencia clara.
¿Por qué es importante implementar un proceso de mejora de datos?
Implementar un proceso de mejora de datos en la empresa es de gran utilidad, incluso para las organizaciones que no alcanzan una comprensión clara de los mismos o que carecen de un determinado perfil tecnológico. En Powerdata hemos comprobado, desde nuestra experiencia, que los negocios que buscan garantizar la integridad de datos y se preocupan por su calidad necesitan empaparse de este concepto, para poder exportarlo a todos los niveles de su organigrama.
Los beneficios de una mejora de datos para una empresa son numerosos y frecuentemente difíciles de medir ya que muchos son intangibles. Pero sí que podemos nombrar algunos de los más importantes:
- Reducción de costes: unos de los principales beneficios de la mejora de la integridad de datos es una reducción de costes. Las empresas pueden conseguir ahorrar a través de un enfoque unificado para el control de crédito y facturación, así como la reducción de costes de envío, lo que a su vez tiene un beneficio para el medio ambiente.
- Incremento de ventas: muchas empresas experimentan un aumento en las ventas como resultado de invertir en mejorar los datos. Una estructuración de los datos puede facilitar ventas cruzadas (cross-selling) y ventas dirigidas (up-selling), así como una mejor gestión de las relaciones con los clientes. Además también se puede utilizar el aumento de integridad de datos para investigar tendencias y detectar lagunas en el mercado que permitan la creación de nuevos productos o servicios.
- Mejora de la satisfacción del cliente: cuanto mejores seas los datos, más fácil será proporcionar el enfoque personalizado que los clientes requieren. Además de mejorar la satisfacción del cliente, también se consigue aumentar la moral del personal.
- Mejora la toma de decisiones: un beneficio final de la mejora de datos es que permite tomar mejores decisiones de negocio. Se consigue desplegar a nuestro personal de manera más eficiente reduciendo los riesgos para la organización.
¿Qué roles participan en una iniciativa de mejora de calidad de datos?
La consecución de objetivos, en concreto del de calidad de datos, requiere de la participación activa, responsable y comprometida de todos quienes intervienen, de una u otra forma, sobre el ciclo de vida del dato. Ya sea porque los generan, porque los consumen, porque los dotan de una estructura... el rol en sí, de forma aislada no tiene un sentido completo, ya que requiere de una concepción conjunta que globalice su relevancia, para optimizar la eficacia de cada actuación individual, minimizando el riesgo.
Los siguientes son un conjunto de roles que pueden participar en una iniciatica de mejora de calidad de datos:
Jefe de datos o Chief Data Officer (CDO): Es el responsable de calidad de datos de la empresa así como de utilizar la información como un activo mediante procesamiento de datos, análisis, data mining y otros. El CDO reporta principalmente al director ejecutivo (CEO) de la empresa.
Propietario de los datos: Son responsables de calidad de datos de un conjunto de datos definidos. Por ejemplo el director de finanzas puede ser el propietario de datos para los datos finanzas de la organización.
Administrador de datos: La diferencia entre el propietario de datos y administrador de datos es que éste último es responsable de los datos en el día a día.
Productor de datos: Son aquellos que generan los datos a través de captura de datos o creación a través de aplicaciones u otros medios.
Consumidor de datos: Estas son las personas que utilizan los datos. Es importante que los datos sean lo suficientemente buenos para que puedan hacer su trabajo, pero tienen que ser responsables de definir lo que hace que los datos sean lo suficientemente buenos para usarlos.
4 pistas para averiguar en qué consiste la calidad de datos
Es importante aclarar, llegados a este punto, que la calidad de datos no sólo se refiere a la ausencia de defectos. Un dato puede ser completo pero puede estar falto de otras cualidades, imprescindibles para su misión; o puede ser confiable pero necesitar de la dirección correcta, que lo encuadre debidamente permitiendo a su usuario sacar rendimiento a su consumo. Por eso, la calidad del dato, tan unida al concepto de integridad, se articula en base a:
La
visión única: que los datos deben proporcionar.
La relación e interrelación: con todas las fuentes y sistemas, siempre de la manera correcta.
La
consistencia, completitud y adecuación de los datos en cuanto a su función.
El cumplimiento de normativas y leyes, porque las organizaciones no son entes aislados, sino que se encuadran en una sociedad que cuenta con sus propias reglas.
Todo proceso de mejora de datos requiere de mediciones, ya que sólo de esta forma es posible aspirar a garantizar la calidad de datos. El papel que la integridad juega en un proyecto de este tipo, desde su posición de atributo de la calidad, es indicar que los datos son totalmente coherentes.