Para seleccionar las mejores herramientas big data para análisis es fundamental entender los requisitos de procesamiento de datos tanto transaccionales como analíticos de nuestros sistemas y tras esto, elegir en consecuencia.
Los objetivos y, por lo tanto, la tecnología necesaria para manejar datos transaccionales, a diferencia de las herramientas big data necesarias para el procesamiento analítico de datos, son bastante diferentes. Para elegir las herramientas big data de análisis correctas, es importante entender tanto las grandes diferencias como los matices sutiles que diferencian los datos operativos de los datos que son más analíticos.
La gestión de datos operativos o transaccionales busca garantizar la baja latencia en los tiempos de respuesta y en la gestión de una variedad de solicitudes simultáneas. Aunque, en ocasiones, la analítica en tiempo real puede estar involucrada, generalmente las consultas analíticas suelen quedar limitadas a un pequeño conjunto de variables relevantes para los procesos de toma de decisiones más inmediatos.
Es habitual que dicha información se muestre en un tablero simple que permita a los usuarios de negocio ejecutar informes, estándar o personalizados, en función de sus propias necesidades y nivel de experiencia.
Sin embargo, independientemente del tipo de motivación que inicie el proceso de reporting, una de las características más importantes de una transacción de datos es la confiabilidad. Es necesario mantener la coherencia transaccional y ello depende de elegir la solución correcta para los datos de la organización.
Las herramientas de análisis de Big Data han surgido para cargas de trabajo interactivas en tiempo real y análisis complejos y retrospectivos de conjuntos de datos más grandes. Las diferencias entre los dos podrían sintetizarse de la siguiente forma:
Confiar en un solo sistema de base de datos para manejar ambos tipos de actividad requiere mucha mano de obra para TI, ya que los sistemas de bases de datos convencionales demuestran una gran variabilidad en el rendimiento cuando se les pide manejar cargas de trabajo analíticas y transaccionales.
Por supuesto, no todas las herramientas big data de análisis satisfacen todas las necesidades posibles, lo que significa que, a nivel empresarial, la mayoría de las organizaciones terminan usando sistemas complementarios para satisfacer todas sus necesidades de carga de datos.