HADOOP

¿QUÉ ES HADOOP framework?

Hadoop es un sistema de código abierto que se utiliza para almacenar, procesar y analizar grandes volúmenes de datos; cientos de terabytes, petabytes o incluso más.
Hadoop surgió como iniciativa open source (software libre) a raiz de la publicación de varios papers de Google sobre sus sistemas de archivo, su herramienta de mapas y el sistema BigTable Reduce. Como resultado nació un conjunto de soluciones en el entorno Apache: HDFS Apache, Apache MapReduce y Apache HBase; que se conocen como Hadoop, con herramientas como Sqoop (para importar datos estructurados en Hadoop cluster) o NoSQL (para realizar el análisis de los datos no estructurados) entre otros.
¿Por qué es bueno Hadoop?
En en el entorno tecnológico que actualmente se mueven todas las organizaciones, donde los sistemas no sólo son capaces de generar e ingestar los datos rápidamente sobre formatos estructurados (SQL), también, cada vez más, se generan datos que no son estructurados (NoSQL).

Hadoop es capaz de almacenar toda clase de datos: estructurados, no estructurados, semiestructurados; archivos de registro, imágenes, video, audio, comunicación, etc
Por otra parte Hadoop también destaca por tener una arquitectura con capacidad de asegurar una alta disponibilidad y recuperación de los datos que ingesta.

CCA Spark y Hadoop Developer Exam (CCA175)

Número de preguntas:  8–12 tareas basadas en el rendimiento (prácticas).
Límite de tiempo:  120 minutos
Puntuación de aprobación:  70%
Idioma:  ingles
Precio:  USD $ 295


Fuente:
Apache. (2014). apache handoop. 2019, de Apache Sitio web: https://hadoop.apache.org/

Comentarios

Entradas más populares de este blog

ITAF

MOF

SABSA