Cursos de SMACK Stack for Data Science

SMACK es una colección de software de plataforma de datos, es decir Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, y Apache Kafka. Utilizando el paquete SMACK, los usuarios pueden crear y escalar plataformas de procesamiento de datos.

Este entrenamiento guiado por instructores, en vivo (online o on-site) está dirigido a científicos de datos que desean utilizar el SMACK stack para construir plataformas de procesamiento de datos para soluciones de datos grandes.

Al final de este curso, los participantes podrán:

Implementar una arquitectura de pipeline de datos para el procesamiento de datos grandes.
Desarrollar una infraestructura de cluster con Apache Mesos y Docker.
Analizar los datos con Spark y Scala.
Gestión de datos no estructurados con Apache Cassandra.

Formato del curso

Lecciones y discusiones interactivas.
Muchos ejercicios y prácticas.
Implementación de manos en un entorno de laboratorio en vivo.

Opciones de Customización de Curso

Para solicitar una formación personalizada para este curso, por favor contacta con nosotros para organizar.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Programa del Curso

Introducción

Descripción general de SMACK Stack

¿Qué es Apache Spark? Características de Apache Spark
¿Qué es Apache Mesos? Características de Apache Mesos
¿Qué es Apache Akka? Características de Apache Akka
¿Qué es Apache Cassandra? Características de Apache Cassandra
¿Qué es Apache Kafka? Características de Apache Kafka

Scala Idioma

Scala Sintaxis y estructura
Scala Flujo de control

Preparación del entorno de desarrollo

Instalación y configuración de la pila SMACK
Instalación y configuración Docker

Apache Akka

Uso de actores

Apache Cassandra

Creación de una base de datos para operaciones de lectura
Trabajar con copias de seguridad y recuperación

Conectores

Creación de una secuencia
Creación de una aplicación Akka
Almacenamiento de datos con Cassandra
Revisión de conectores

Apache Kafka

Trabajar con clústeres
Creación, publicación y consumo de mensajes

Apache Mesos

Asignación de recursos
Ejecución de clústeres
Trabajar con Apache Aurora y Docker
Ejecución de servicios y trabajos
Implementación de Spark, Cassandra y Kafka en Mesos

Apache Spark

Administración de flujos de datos
Trabajar con RDD y tramas de datos
Realización de análisis de datos

Solución de problemas

Manejo de fallas de servicios y errores

Resumen y conclusión

Requerimientos

Comprensión de los sistemas de procesamiento de datos

Audiencia

Científicos de datos

14 horas

Testimonios (1)

very interactive...