El valor de la gestión de datos

10 claves para saber cómo elegir una solución de calidad de datos

Publicado el 21/08/14 4:00

Quienes se hayan informado a través de internet o hayan leído un libro sobre calidad de datos conocerán la importancia de preservar los atributos de calidad del dato para el futuro del negocio. La imagen que la empresa proyecta hacia el exterior, la eficiencia de costes, los niveles de rendimiento... todo gira en torno a la confianza, completitud, exactitud e integridad de los datos.

libro sobre calidad de datos

Créditos fotográficos: "Quality Diagram Shows Excellent Or Premium Condition" by Stuart Miles

Elegir una solución de calidad de datos es una tarea compleja puesto que se deben combinar diferentes variables con fines contrapuestos:

  • La obtención de la máxima calidad: como explicamos en el libro gratuito sobre "calidad de datos. Una radiografía completa", alcanzar el 100% de calidad es una utopía. Por eso, cada empresa, ha de calcular hasta qué nivel de calidad está dispuesto a llegar y puede mantener.

  • La mínima inversión posible: el presupuesto destinado a la calidad tiene mucho que ver con la elección final. Tareas de identificación, perfilado, limpieza, matching, la convivencia de distintas fuentes de origen y su heterogeneidad son algunos de los factores que contribuyen a incrementar el precio del aseguramiento de la calidad de datos en la empresa.

  • Profesionales cualificados: en un proyecto de calidad intervienen distintos roles, desde el analista hasta el data steward o el arquitecto de datos. Muchas veces, la organización no dispone de estos perfiles y ha de buscarlos fuera. Otro aspecto a considerar es que la responsabilidad sobre la calidad no se reduce al Departamento de IT, sino que profesionales de otras áreas también han de trabajar para alcanzar determinados estándares. Formación, tiempo y esfuerzo que se va sumando a una lista de exigencias a las que no todas las compañías pueden hacer frente de la misma manera.

Accede GRATIS al Webinar sobre calidad de datos en el mundo Big Data

Cómo elegir la solución idónea en 10 claves: lo que no se aprende en ningún libro sobre calidad de datos

A la hora de seleccionar solución de calidad de datos existen 10 prioridades relativas a las técnicas empleadas, las estructuras de equipo, los tipos de herramientas, los métodos, modos de pensar y otras características que son deseables para una solución. Sin embargo, la interpretación de este listado no debe hacerse de forma exhaustiva sino selectiva, ya que no todas las organizaciones necesitan o quieren abrazar las diez claves: hay que priorizar y escoger.

Las 10 claves para elegir solución de calidad de datos son:

  1. Ampliar el abanico de calidad: la calidad de datos es el resultado de la puesta en práctica de distintas técnicas relacionadas entre sí. Pese a que en muchas organizaciones se aplican sólo una de ellas, es necesario expandirse a más técnicas, aplicarlas a más conjuntos de datos y hacerlas llegar a todos los dominios de datos posible.
  2. Lograr la calidad de los datos en tiempo real: ni master data management ni integración. Conseguir que los datos puedan ser limpiados y estandarizados a la vez que se produce su generación o actualización debe ser el objetivo.
  3. Reutilizar: ganar en consistencia y en interoperabilidad es cuestión de un mejor servicio de calidad de datos.
  4. Coordinar con otras disciplinas de gestión de datos: las funcionalidades de una buena solución de calidad de datos pueden resultar muy beneficiosas para las disciplinas de gestión de datos relacionados. Por ejemplo, al aplicarse a los datos de referencia que gestiona una solución MDM, o en lo relativo a  soluciones de integración de datos.
  5. Apoyar a la función de gobierno de datos: en vez de reinventar estructuras, resulta mucho más práctico  tomar algunas de las estructuras organizativas y procesos de la gestión realizada por la solución de calidad de datos y aplicarlos a la gobernabilidad de datos, reduciendo riesgos y aumentando su eficiencia.
  6. Nuevas capacidades: nuevas fuentes y tipos de datos llegan cada día demandando una respuesta, que llega en forma de estrategia de calidad de datos, que ha de adecuarse a esta realidad y garantizar la escalabilidad.
  7. Adaptarse a las normas: la versatilidad es una prioridad a la hora de elegir solución de calidad de datos. Cumplir con la reglamentación local e internacional es una necesidad para evitar multas y problemas legales.
  8. Centrarse en el proceso de valor agregado: ya que es la única manera de garantizar la mejora continua y de trabajar en un entorno de reutilización y actualización de datos.
  9. Profundizar más en el contenido de los datos: quedarse en la superficie implica perder oportunidades, alejarse de nuevos descubrimientos y avanzar en dirección contraria a la de la mejora de la calidad de los datos.
  10. Buscar que la solución elegida cubra todas las necesidades del ciclo de vida de la calidad de datos: perfilado, limpieza, enriquecimiento, preagrupación, matching, consolidación, scorecard/reporting y gestión de incidencias. Para conocer más sobre cada una de ellas puede consultarse el libro sobre "calidad de datos. Una radiografía completa".

 

Post relacionados:

 

New Call-to-action

Temas: Data Quality