El valor de la gestión de datos

¿Qué es Hadoop y cómo puede revolucionar el sector bancario?

Posted on Wed, Mar 15, 2017

¿Qué es Hadoop? Apache Hadoop es un framework de software open source escrito en Java para almacenamiento distribuido y procesamiento de conjuntos de datos muy grandes en múltiples clusters.


iStock-494940062.jpg

Créditos fotográficos: NicoElNino

Hadoop fue desarrollado por Doug Cutting y Mike Cafarella en 2005. El núcleo de lo que es Hadoop es Hadoop Distributed File System para almacenamiento y MapReduce para procesamiento de datos.

La filosofía básica de Hadoop es reducir la dependencia de los caros y heredados sistemas hardware para permitir procesamiento paralelo distribuido de cantidades muy grandes de datos, a través de servidores convencionales básicos y de bajo coste de forma que se puedan procesar y almacenar datos sin limitación de volumen.

Hadoop hace que el proceso de almacenamiento y gestión de datos sea económico y fiable gracias a algunas de sus principales características, que lo convierten en una opción:

  • Rentable: se ejecuta tanto en equipos como en redes de trabajo
  • Fiable: su tecnología Fail Safe evita la pérdida de datos, también en los casos en que es el hardware el que falla.
  • Escalable: almacena y distribuye conjuntos de datos para operar en paralelo, permitiendo a las empresas ejecutar aplicaciones en miles de nodos.
  • Potente método de almacenamiento: de hecho, se trata del único basado en el sistema de archivos distribuido. Precisamente debido a esa configuración logra un procesamiento más rápido de los datos.
  • Completa: el ecosistema Hadoop incluye toda clase de APIs sencillas y flexibles que permiten desde la detección del fraude al procesamiento de registros.

Estas cualidades lo convierten en la opción idónea para la industria financiera. Las entidades bancarias, más que preguntarse qué es Hadoop deberían cuestionarse cómo les podría beneficiar.

Es un asunto de valor. Tiene que ver con la capacidad de una organización para convertir datos en algo que vale más, en una fuente de oportunidades y es precisamente ahí donde radica el potencial de Hadoop aliado a Big Data. Algo que ya tienen claro bancos como PNC, BBVA, Bank of America, Credit Suisse o Morgan Stanley, entre otros, que ya llevan tiempo poniendo en práctica su estrategia de grandes datos.  

 

¿Qué es Hadoop en cuanto a su uso en banca?

Hadoop permite a las entidades financieras resolver algunas de sus principales preocupaciones. Además, logra hacerlo en un tiempo récord y en condiciones de coste mínimo. Algunos de los escenarios en los que se utiliza son:

  • Almacenamiento y seguridad de datos: el Sistema de Archivos Distribuidos Hadoop (HDFS) proporciona almacenamiento de datos escalable y fiable, a la vez que MapReduce procesa cada nodo en paralelo. La información queda almacenada en más de un cluster, es fácil de acceder y además constituye una opción de almacenamiento de datos mejor y más segura.
  • Gestión de riesgos: las entidades que ya saben qué es Hadoop lo eligen porque ofrece una visión completa y precisa del riesgo y el impacto, lo que permite a las empresas tomar decisiones informadas analizando los datos transaccionales para determinar el riesgo basado en el comportamiento del mercado, puntuando clientes y clientes potenciales.
  • Detección de fraude: Hadoop permite analizar puntos de venta, autorizaciones y transacciones, logrando identificar y mitigar el fraude. Big Data, a su vez, facilita la tarea de detectar patrones de comportamiento inusuales y alertar a los bancos de los mismos, llegando a hacerlo incluso en tiempo real.

No sólo existen beneficios en torno a la seguridad, el almacenamiento o la gestión del riesgo. Las entidades financieras que saben qué es Hadoop también lo incorporan en su estrategia por sus posibilidades a la hora de llevar a cabo el análisis de datos no estructurados para adquirir una mejor comprensión de sus clientes. Hadoop y su ecosistema son elementos clave a la hora de tomar la decisión más acertada en cada momento.

 

New Call-to-action

Topics: Big Data