¿Qué es Hadoop? Apache Hadoop es un framework de software open source escrito en Java para almacenamiento distribuido y procesamiento de conjuntos de datos muy grandes en múltiples clusters.
Créditos fotográficos: NicoElNino
Hadoop fue desarrollado por Doug Cutting y Mike Cafarella en 2005. El núcleo de lo que es Hadoop es Hadoop Distributed File System para almacenamiento y MapReduce para procesamiento de datos.
La filosofía básica de Hadoop es reducir la dependencia de los caros y heredados sistemas hardware para permitir procesamiento paralelo distribuido de cantidades muy grandes de datos, a través de servidores convencionales básicos y de bajo coste de forma que se puedan procesar y almacenar datos sin limitación de volumen.
Hadoop hace que el proceso de almacenamiento y gestión de datos sea económico y fiable gracias a algunas de sus principales características, que lo convierten en una opción:
Estas cualidades lo convierten en la opción idónea para la industria financiera. Las entidades bancarias, más que preguntarse qué es Hadoop deberían cuestionarse cómo les podría beneficiar.
Es un asunto de valor. Tiene que ver con la capacidad de una organización para convertir datos en algo que vale más, en una fuente de oportunidades y es precisamente ahí donde radica el potencial de Hadoop aliado a Big Data. Algo que ya tienen claro bancos como PNC, BBVA, Bank of America, Credit Suisse o Morgan Stanley, entre otros, que ya llevan tiempo poniendo en práctica su estrategia de grandes datos.
Hadoop permite a las entidades financieras resolver algunas de sus principales preocupaciones. Además, logra hacerlo en un tiempo récord y en condiciones de coste mínimo. Algunos de los escenarios en los que se utiliza son:
No sólo existen beneficios en torno a la seguridad, el almacenamiento o la gestión del riesgo. Las entidades financieras que saben qué es Hadoop también lo incorporan en su estrategia por sus posibilidades a la hora de llevar a cabo el análisis de datos no estructurados para adquirir una mejor comprensión de sus clientes. Hadoop y su ecosistema son elementos clave a la hora de tomar la decisión más acertada en cada momento.