El valor de la gestión de datos

La importancia del Data Quality en los análisis de datos

Publicado el 16/08/16 21:00

analisis-de-datos

La importancia del data quality en los análisis de datos es esencial por distintas razones que aluden a aspectos capitales para toda organización, entre otros obtener el mayor potencial de la información o respetar la normativa de protección de datos.En este sentido, trabajar la calidad de los datos es un aspecto básico, si bien obtener el máximo potencial de ellos no solo significa que sean correctos, sino profundizar en sus distintas dimensiones y enmarcarlos en un adecuado data governance.

 

La calidad, un concepto más exigente

En el actual entorno de Big Data, la complejidad que añaden las nuevas tecnologías y los grandes datos implica una necesidad aún mayor, si cabe, de hacer un especial esfuerzo para garantizar la calidad de los datos.

Que los datos tengan calidad significa, básicamente, conseguir que reúnan los requisitos necesarios para dar su máximo potencial. En concreto, las dimensiones de la calidad apuntadas se refieren a aspectos como la completititud, la conformidad, la consistencia, la precisión, la integridad o evitar la duplicidad.

Su cumplimiento significa que el dato, finalmente, puede considerarse de calidad, y para su logro son necesarias tecnologías apropiadas, con la ventaja de poder contar con soluciones de uso intuitivo, que permiten una implementación escalable y automatizada.

Idealmente, además, dentro en un contexto lo más propicio posible, aquel que puede ofrecerle una compañía data driven. Sea como fuere, la calidad de los datos constituye un requisito irrenunciable para lograr la utilidad buscada. 

Entre ellos, con el fin de realizar análisis que realmente aporten valor para así garantizar el buen funcionamiento de la empresa, tanto a nivel de mantenimiento de procesos productivos como de apoyar la toma de mejores decisiones estratégicas.

 

Data quality, clave en la toma de decisiones

El análisis de los datos que se encuentran en sistemas híbridos, un entorno habitual en la actualidad, requiere contar con tecnología capaz de dar respuesta al nuevo escenario. Pero no solo eso, pues del mismo modo que hemos señalado la importancia de contar con datos de calidad, entendida desde un enfoque más exigente que antaño, soportar el crecimiento de datos que implica la situación actual también exige un ecosistema da hoc.

Sin dejar de ser útiles las tecnologías del paradigma tradicional, se precisan nuevas soluciones para afrontar la gestión de la información que conlleva Big Data. Es en esta nueva realidad, conformada por sistemas puros o híbridos, la calidad de los datos es clave o, lo que es lo mismo, necesitamos disponer de datos que sean auténticos y válidos para nuestros propósitos.

Volviendo a la importancia del data driven, la empresa orientada al dato basa sus decisiones en hechos, con lo que la calidad del dato se convierte en esencial, al tiempo que constituye la materia prima de la analítica. Por lo tanto, la toma de decisiones estratégicas basadas en el análisis de datos se resiente si no cuenta con datos de calidad.

De hecho, el data quality es condition sine qua non para un predictive analytics óptimo, ya que la fiabilidad de las predicciones depende de forma clara de la calidad de los datos. Tanto en lo que respecta a los enfoques convencionales como a los orientados a los grandes datos. Sin una adecuada gestión de calidad de datos, será imposible sacar partido de las herramientas de análisis predictivo propias del Business Intelligence basados en Data Warehouses y/o en Big Data, como la minería de datos o, por ejemplo, el análisis estadístico. Si los datos no son de calidad, los análisis no contarán con la fiabilidad necesaria y, obviamente, tampoco lo harán las decisiones basadas en ellos.

Fuente imagen: suphakit73 / FreeDigitalPhotos.net

calidad de datos sofisticada 

 

Temas: Data Quality