Cuando una empresa debe hacer una migración a sistemas nuevos o encarar un proceso de transformación digital, uno de los primeros desafíos que aparecen es el de la calidad de datos.
Las compañías aprovechan esas circunstancias para mejorar la integración y calidad de datos verificar y no es raro descubrir que se impone —muchas veces, de manera imperiosa— un proceso de limpieza de los datos (data cleaning), algo que debería haberse hecho hace tiempo y regularmente.
¿Por qué es tan importante mantener la calidad de datos? ¿En qué medida el éxito de los negocios depende de esto?
Las empresas descartan hasta el 38% de los datos que recopilan debido a problemas de calidad.
Fuente: Kantar
|
¿Qué es Data Quality?
Data Quality, consiste en un conjunto de características sobre la información recogida en una base de datos, un sistema de información o un data warehouse: exactitud, completitud, integridad, actualización, coherencia, relevancia, accesibilidad y confiabilidad necesarias para resultar útiles al procesamiento, análisis y cualquier otro fin que un usuario quiera darles.
Según a quien se le pregunte, Data Quality es todo un proceso completo en sí o parte de uno más grande que algunos llaman Data Management, otros Data Preparation, Data Cleansing o Data Optimization.
Este proceso incluye la administración de programas, roles, estructuras organizacionales, casos de uso y procesos y también está vinculado a iniciativas más amplias en el campo de la gestión de información empresarial, incluida la gobernanza de la información y la gestión de datos maestros. Entre los beneficios más destacados del uso de datos de calidad se encuentran una mejor toma de decisiones y consistencia, mayor escalabilidad, una mejor preparación para enfrentar los cambios del entorno, medidas sobre clientes más certeras, menores costos y productividad más alta.
Asimismo, la difusión de herramientas como Big Data y Machine Learning, el uso de bases no estructuradas y los procesos de automatización generan una mayor dependencia de datos limpios, contextuales y confiables para obtener resultados correctos.
Una mejora del 10% en la calidad de datos del cliente puede vincularse con una mejora del 5% en la capacidad de respuesta del cliente, gracias a una mejor y más rápida atención.
Fuente: Gartner
|
4 pasos fundamentales para mejorar la calidad de datos
Toda estrategia de datos debe contemplar una práctica de data quality para asegurar su integridad, coherencia, confiabilidad y accesibilidad.
Los cuatro pasos fundamentales a implementar para lograr mejoras en la gestión de calidad de sus datos son:
- Descubrimiento: Sólo se puede planear un trayecto de calidad de datos una vez que se entienda el punto de partida. Para hacerlo, hay que evaluar el estado actual de los datos: dónde residen, su sensibilidad, las relaciones de datos, y cualquier problema de consistencia que tenga.
- Definición de reglas: La información que se recoge durante la fase de descubrimiento determina las decisiones sobre el proceso de calidad de los datos que se necesitan y las reglas que se crearán para alcanzar el estado final deseado. Por ejemplo, puede que se necesite limpiar y eliminar duplicaciones de datos, estandarizar su formato o descartar datos anteriores a una fecha determinada. Hay que tener en cuenta que se trata de un proceso de colaboración entre las diversas áreas de la empresa y TI.
- Aplicar las reglas: Una vez que se hayan definido, integrarlas en los conductos de datos es el siguiente paso. Las herramientas de calidad de datos deben integrarse en todas las fuentes y objetivos de datos para remediar la calidad en toda la organización.
- Supervisar y gestionar: La calidad de los datos no es un ejercicio de una sola vez. Para mantenerla, es necesario poder supervisar e informar sobre todos los procesos de calidad de los datos de forma continua, en las instalaciones y en la nube, utilizando cuadros de mando, tarjetas de puntuación y visualizaciones.
Una vez que se han eliminado los errores de calidad, los datos “limpios” deben reemplazar a los que no lo están en las fuentes originales, para que las aplicaciones puedan beneficiarse también de ellos y evitar la necesidad de más acciones de data cleansing en el futuro.
Aunque una empresa tenga la seguridad de que sus datos están limpios y actualizados, es conveniente implementar de forma regular un proceso de calidad como prioridad absoluta. Con los datos correctos, las empresas pueden tomar decisiones que les ayudarán a prosperar en un entorno en constante cambio y obtener resultados confiables.