El valor de la gestión de datos

Libro de Hadoop para Dummies

Publicado el 17/05/14 4:00

Apache Hadoop es mucho más que un sistema para almacenar, procesar y analizar grandes cantidades de datos utilizando servidores básicos. Se trata de un marco de código abierto que constituye una herramienta revolucionaria en el entorno Big Data, capaz de hacer accesibles análisis que antes eran inviables por su costo y complejidad. 

Hadoop for DummiesSin embargo, su uso requiere de conocimientos especializados, de ahí que los recursos autodidactas, al margen de cursos académicos, puedan ayudar a un principiante en Hadoop a iniciarse y ampliar sus habilidades empezando prácticamente desde cero. 

Para los usuarios que deseen iniciarse en su aprendizaje sin saltarse peldaños, los manuales elementales son un buen primer paso.

Conocer lo esencial puede resultar interesante siempre y cuando no se tengan ya algunos conocimientos que hagan innecesario leerlos. Hacerlo, de hecho, muy probablemente sería una pérdida de tiempo, habida cuenta de la completa lista de libros de todos los niveles sobre Hadoop que hay en el mercado. 

Descárgate aquí la guía "Qué significa Hadoop en el mundo del Big Data" y  resuelve todos los desafíos Big Data.   

Hadoop para Dummies

Una introducción útil y amena para entender qué es Hadoop, incluyendo su historia, retos tecnológicos y lenguajes de programación es el libro Hadoop para Dummies, de Robert D. Scheneider (2012), analista de Silicon Valley, escritor y articulista de temáticas relacionadas con las tecnologías de Big Data. 

En sus 45 páginas de contenido, dividido en cinco capítulos, encontraremos una sencilla visión de hadoop, de fácil lectura, como corresponde a la serie Dummies de la editorial Jooh Wiley & Sons, aunque en esta ocasión está patrocinado por IBM. Brevemente, el autor nos introduce en su utilidad, desde la tecnología de MapReduce u otras complementarias hasta la implementación de Hadoop cómo optimizar la aplicación. 

Se trata de un somero repaso que ofrece una panorámica general, si bien los ya iniciados corren el riesgo de no encontrar nada nuevo, ni tampoco los neófitos estarán listos para configurar su propio clúster Hadoop, y algo similar puede decirse de un segundo título homónimo: Hadoop para Dummies, de Dirk de Roos, Paul C. Zikopoulos, Romano B. Meinyk Bruce Brown Y Rafael Crosss, todos pesos pesados del sector. 

En este caso, sus más de 400 páginas son una introducción más exhaustiva que ayuda a encontrar la fórmula más adecuada dentro del complejo ecosistema Hadoop, pero igualmente introductoria. En todo caso, se hace más énfasis en la construcción y gestión fácil de aplicaciones Hadoop, así como en evitar problemas comunes o en su orientación para la minería de datos, análisis web y otros retos que requieran hacer frente a grandes volúmenes de datos. 

¿Quieres implementar un proyecto de Big Data?  Consulta con un experto para lograr que tu iniciativa en Big Data tenga éxito

Dar un paso más

Hay un sinfín de libros de Hadoop en el mercado que profundizan en distintos temas y abordan la cuestión a un nivel más profesional. Entre ellos, uno imprescindible es la conocida y bien considerada guía de Tom White, Hadoop, The Definitive Guide, recomendada como práctico manual de consulta si ya se trabaja con Hadoop.

Otra opción para adentrarse en este proceloso framework de software para aplicaciones distribuidas son los cursos de capacitación. Más allá de los realizados en Cloudera, IBM o MAPR, hay recursos libres que pueden ayudar a iniciarse o reciclarse. La BigDataUniversity.com emite certificados de cumplimiento e incluso hay disponible una descarga gratuita del e-book Hadoop for Dummies de Scheneider para usuarios registrados.

 

Post relacionados:

hadoop y el bigdata

Temas: Big Data