Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa del Curso
Descripción general de Big Data:
- ¿Qué es Big Data
- Por qué Big Data está ganando popularidad
- Big Data Estudios de caso
- Big Data Características
- Soluciones a trabajar Big Data.
Hadoop y sus componentes:
- Qué es Hadoop y cuáles son sus componentes.
- Hadoop Arquitectura y sus características de los datos que puede manejar /Process.
- Resumen sobre Hadoop Historia, empresas que lo utilizan y por qué han empezado a utilizarlo.
- Hadoop Marco y sus componentes: explicados en detalle.
- ¿Qué es HDFS y lee -Escribe en Hadoop Sistema de archivos distribuido.
- Cómo configurar Hadoop el clúster en diferentes modos: clúster independiente/pseudo/multinodo.
(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben examinarse cuidadosamente, la ejecución de los demonios de Hadoop y la prueba del clúster).
- ¿Qué es el marco de trabajo de Map Reduce y cómo funciona?
- Ejecución de trabajos de Map Reduce en el clúster Hadoop.
- Descripción de la replicación, la duplicación y el reconocimiento de bastidores en el contexto de Hadoop clústeres.
Hadoop Planificación de clústeres:
- Cómo planear el clúster de Hadoop.
- Comprensión del hardware y el software para planificar el clúster de Hadoop.
- Comprender las cargas de trabajo y planificar el clúster para evitar errores y un rendimiento óptimo.
¿Qué es MapR y por qué MapR?
- Descripción general de MapR y su arquitectura.
- Comprensión y funcionamiento del sistema de control MapR, volúmenes MapR, instantáneas y espejos.
- Planificación de un clúster en el contexto de MapR.
- Comparación de MapR con otras distribuciones y Apache Hadoop.
- Instalación de MapR y despliegue de clústeres.
Configuración y administración de clústeres:
- Gestión de servicios, nodos, instantáneas, volúmenes espejo y clústeres remotos.
- Comprensión y gestión de nodos.
- Comprensión de Hadoop componentes, Instalación de Hadoop componentes junto con MapR Services.
- Acceso a los datos en el clúster, incluso a través de NFS, administración de servicios y nodos.
- Gestión de datos mediante el uso de volúmenes, gestión de usuarios y grupos, gestión y asignación de roles a los nodos, puesta en marcha, desmantelamiento de nodos, administración de clústeres y supervisión del rendimiento, configuración/análisis y supervisión de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
- Comprender y trabajar con M7: almacenamiento nativo para tablas MapR.
- Configuración y ajuste del clúster para un rendimiento óptimo.
Actualización del clúster e integración con otras configuraciones:
- Actualización de la versión de software de MapR y tipos de actualización.
- Configuración del clúster de Mapr para acceder al clúster de HDFS.
- Configuración del clúster de MapR en Amazon Elastic Mapreduce.
Todos los temas anteriores incluyen demostraciones y sesiones de práctica para que los alumnos tengan experiencia práctica con la tecnología.
Requerimientos
- Conocimientos básicos de Linux FS
- Java básico
- Conocimientos de Apache Hadoop (recomendado)
28 horas
Testimonios (1)
practical things of doing, also theory was served good by Ajay