Si bien las empresas están continuamente buscando nuevas oportunidades para conseguir ventajas de los datos que provienen de big data, el Reglamento General de Protección de Datos de la Unión Europea (GPDR) que entra en vigor en 2018, impone nuevas obligaciones a tener en cuenta en la protección de datos de empresas.
Esta nueva ley modifica la forma en que las organizaciones interactúan con los datos personales y por lo tanto afecta también a cómo se analizan. Sin embargo, lo que puede parecer un problema podría suponer una oportunidad para que las empresas cambien la forma en que abordan sus capacidades de gobernabilidad.
El big data complica el proceso de mantener el cumplimiento de GPDR así como otras normas de protección de datos de empresas. El volumen de datos es enorme y son transformados en diferentes formas y son usados de diferentes maneras. Y el GPDR se debe aplicar a todos los datos, ya sean proporcionados voluntariamente o recopilados por sistemas automatizados. Esto incluye datos personales almacenados y utilizados en data lakes y plataformas de big data.
La gestión de todos estos datos puede parecer una tarea insalvable. Sin embargo, con un plan de gobierno de datos integral, las organizaciones pueden hacer posible que los datos sean seguros y confiables e impulsar procesos de análisis más rápidos y colaborativos.
Para gobernar los datos de forma efectiva y cumplir con GDPR es necesaria una combinación de personas, procesos y herramientas que se entrelazan a través de cuatro aspectos clave:
El proceso de descubrimiento es fundamental para identificar todas las características de los datos privados que deben ser gestionadas en conformidad con GDPR. Esto requiere una exploración extensiva de los datos para entender si se ha dado el consentimiento para usar los datos.
El proceso de exploración de datos es mucho más amplio que la simple identificación de datos personales privados. También incluye identificar:
La gobernanza no desempeña un papel muy fuerte en esta etapa, pero el descubrimiento de big data sí lo hace. Los analistas requieren herramientas de descubrimiento de datos avanzadas y fáciles de usar para evaluar el estado de los datos y determinar dónde aplicar permisos que permitan la protección de datos de empresas. Un proceso de trazabilidad de los datos también proporcionará información valiosa sobre el origen de los datos y cómo se transformaron.
Una vez que los datos personales privados se catalogan, clasifican y dividen, pueden entonces asegurarse y gobernarse. Esto requerirá la aplicación de diferentes políticas a los datos en diversas formas y etapas.
Asegurar y gobernar los datos requiere una serie de capacidades críticas aplicadas según sea necesario, incluyendo:
La monitorización y gestión de los pipelines analíticos que involucran datos de clientes privados pueden convertirse rápidamente en algo muy complejo. Los datos de los clientes son utilizados de muchas maneras diferentes (up-sell, cross-sell, retención, engagement y más), y eso puede provocar que perdamos el control tanto de los datos como de la forma en que se utilizan perjudicando de esta forma la protección de datos de empresas.
Para obtener una vista completa de cómo se usan los datos de los clientes será necesario:
Cumplir con las regulaciones de GDPR requiere probar que tenemos los controles y los procesos apropiados para poder tener una protección de datos de empresas adecuada que permita utilizarlos correctamente de acuerdo con los consentimientos de cada individuo. El volumen de datos y los análisis realizados sobre ellos son cada vez mayores y eso hace que los procesos manuales que informan sobre el cumplimiento de GDPR se conviertan en una gran pérdida de recursos para un personal de TI que ya está bastante saturado.
Las organizaciones que mejor lo están haciendo están consolidando información sobre los procesos GDPR en repositorios centrales, soluciones de catalogación o sistemas de control de TI. Esto permite una visión en toda la empresa de todos los datos personales, cómo se utilizan y cómo se gestionan. Se simplifican y agilizan los procesos de auditoría e informes para GDPR.
Para conseguir una protección de datos de empresas en plataformas Hadoop, hay cinco consideraciones clave que deben tenerse en cuenta:
Los datos son clave para todas los interesados tanto de dentro como de fuera de la empresa. Explotados en profundidad, los datos llevan a las empresas a nuevas oportunidades de negocio, así como a conseguir ventajas competitivas. Simultáneamente, los datos son una bomba de tiempo que puede explotar si no está adecuadamente asegurada, protegida, gobernada y controlada.
Con la gran cantidad de datos personales que se utilizan para el análisis de big data, es esencial seleccionar una plataforma que proporcione la funcionalidad más completa posible de forma que se pueda obtener una protección de datos de empresas compatible con GDPR mientras se sigue reduciendo la carga administrativa necesaria para administrar los procesos de cumplimiento.