Algunas empresas empiezan a plantearse si lo que más les conviene es el gobierno de datos, frente al autoservicio BI. Les surge la duda de cómo mantener la agilidad necesaria para la gestión de la información con un catálogo, una cuestión que integrated services podría resolver.
Hambre de datos
Los usuarios de negocio siempre han estado ávidos de información, incluso mucho antes de que se oyese hablar de integrated services. De hecho, ya en la década de los noventa algunos descubrían y combinaban, por su cuenta, datos de diferentes fuentes, para después agregarlos en Excel y presentarlos a otros compañeros o superiores, en forma de conocimiento procesado.
Con la llegada de avances en la tecnología, como las herramientas de autoservicio de Business Intelligence, la agregación, visualización e intercambio de datos se volvieron mucho más sencillos.
De la noche a la mañana, los usuarios de negocio parecían dominar la gestión de datos, se sentían autosuficientes, independientes de IT, aunque este departamento es el que, durante años, preparó y gobernó el uso de datos en la empresa. Sin embargo, esta nueva realidad llegó con nuevos problemas:
- Correlación, causalidad y cobertura. Con las herramientas de BI en autoservicio, las organizaciones esperaban que los usuarios de negocio encontrasen por sí mismos las causas de los principales problemas pasados, pronosticaran mejor las situaciones del mercado en el futuro y tomaran mejores decisiones en el presente. Sin embargo, el camino hacia el conocimiento está lleno de obstáculos. La mayoría de los análisis no tienen en cuenta todos los datos, incluso cuando están disponibles en la empresa. Es más, aun cuando los usuarios saben que un atributo en particular puede mejorar un análisis, a veces no lo usan por diferentes motivos (como el no poder encontrarlo). Esto da como resultado análisis incompletos y sin correlación, que conducen a decisiones incorrectas.
- Datos incorrectos que llevan a análisis impreciso. En ocasiones, después de que los usuarios de negocio realizan todo el trabajo de descubrir fuentes de datos, crear informes y generar nuevas ideas minuciosamente, se dan cuenta de que los datos que han utilizado estaban obsoletos, provenían de una fuente incorrecta o tenían problemas graves de calidad de datos. A veces se dan cuenta de que han usado la información sin comprender el contexto empresarial. En todo caso, la consecuencia es que las organizaciones se están ralentizando al darse cuenta de la poca confiabilidad de los informes y paneles creados por los usuarios para tomar decisiones significativas.
- Repetición de todo el proceso de preparación. La preparación de datos de autoservicio y la BI también dieron como resultado que una gran cantidad de usuarios realizaran las mismas tareas de preparación, estandarización y reconciliación, una y otra vez, para los mismos conjuntos de datos sin procesar. Este problema concentra los esfuerzos de toda la organización en la repetición de las mismas tareas, lo que supone un malgasto de tiempo y recursos.
Tal vez te interese leer:
Database marketing: trasforma tu análisis
¿Cómo puede ayudar un catálogo de datos? Hablemos de integrated services
Está claro que, junto con las herramientas de autoservicio de BI y preparación de la información, un perfil de negocio acostumbrado al trabajo con datos necesita otras capacidades adicionales para ser verdaderamente eficaz. Se trata de las siguientes:
- Búsqueda: la capacidad de encontrar rápidamente datos relevantes para las necesidades de análisis es esencial para obtener valor de los datos. Esta búsqueda también debería llevar al usuario a obtener el contexto empresarial y de uso de los datos, permitiéndole conocer ¿quién ha usado los mismos conjuntos de datos en el pasado? ¿Para qué tipos de análisis? ¿Cómo se transformaron? ¿Cuáles son los otros conjuntos de datos relacionados? Estos usuarios realmente necesitan una especie de buscador para activos de datos empresariales, al más puro estilo de los generales que existen online. Las empresas que apuesten por invertir en una solución de este tipo deberán priorizar las opciones que les permitan indexar automáticamente metadatos de la mayoría de las fuentes de datos y aplicaciones en la empresa. Además, deberían asegurarse de que, una vez indexados, los metadatos empresariales del glosario de negocio puedan asociarse con activos técnicos para ayudarles a buscar estos conjuntos de datos utilizando términos de negocio, en lugar de jerga técnica. Por último, no hay que olvidarse de preguntar al proveedor si el sistema analiza el movimiento de datos y las fuentes de preparación de datos, catalogando e indexando recetas y mapeos que puedan ayudar con la reutilización del trabajo en la transformación de datos.
- Establecer confianza: la capacidad de confiar en el activo de datos descubierto también es important Solo así se puede descubrir a qué nivel llega la calidad de los datos del conjunto de datos, si ese conjunto se usó en informes externos y si es o no confiable, por ejemplo. Tener al alcance estadísticas de calidad y relaciones de linaje de datos permite a toda la organización elevar la confianza y relevancia de los sistemas de información, confirmando su idoneidad para cubrir las necesidades de análisis, algo que solo es posible con integrated services.
- Clasificaciones: otro aspecto que resulta esencial es la capacidad de clasificar conjuntos de datos para una mejor gestión. Las clasificaciones pueden llevarse a cabo en varias dimensiones, como la propiedad de los datos o las ubicaciones geográficas, o la etiqueta semántica de los datos contenidos. Estas clasificaciones son la clave de integrated services y el primer paso para gobernar, gestionar y extraer valor de los datos. Sin embargo, para problemas de clasificación de datos de nivel empresarial, también hacen falta plataformas que puedan escalar. Si el sistema depende de humanos para clasificar todos los activos de datos manualmente, hará falta demasiado tiempo para poder clasificar toda la información, mientras que, si las clasificaciones se realizan automáticamente, todo el tiempo humano se destinará a la limpieza de falsos positivos. Elegir una herramienta que lleve a cabo la clasificación y la complemente con una función de dominio inteligente permite a los usuarios anotar manualmente columnas con etiquetas de dominio y luego aplicar técnicas de aprendizaje automático para propagar estas etiquetas a otras columnas "similares". Si se escoge al proveedor adecuado, podría conseguirse que los usuarios creasen atributos personalizados para clasificar activos de datos en múltiples dimensiones.
Si bien no se puede negar que el autoservicio es el camino a seguir, es necesario equilibrarlo con la cantidad adecuada de gobierno para obtener los mejores resultados a nivel de análisis. Integrated services, especialmente cuando estos servicios se basan en una plataforma de clasificación impulsada por aprendizaje automático es la solución hecha a la medida de los usuarios de negocio que quieren destacar en sus iniciativas de datos.