Cursos de Apache Spark Fundamentals

Apache Spark es un motor de análisis diseñado para distribuir datos a través de un cluster con el fin de procesarlo en paralelo. Contiene módulos para streaming, SQL, aprendizaje de máquina y procesamiento de gráficos.

Este entrenamiento guiado por instructores, en vivo (online o on-site) está dirigido a ingenieros que desean implementar Apache Spark sistema para el tratamiento de cantidades muy grandes de datos.

Al final de este curso, los participantes podrán:

Instalar y configurar Apache Spark.
Conoce la diferencia entre Apache Spark y Hadoop MapReduce y cuándo usar.
Leer rápidamente en y analizar conjuntos de datos muy grandes.
Integrar Apache Spark con otras herramientas de aprendizaje de máquina.

Formato del curso

Lecciones y discusiones interactivas.
Muchos ejercicios y prácticas.
Implementación de manos en un entorno de laboratorio en vivo.

Opciones de Customización de Curso

Para solicitar una formación personalizada para este curso, por favor contacta con nosotros para organizar.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Programa del Curso

Introducción

Apache Spark frente a Hadoop MapReduce

Descripción general de Apache Spark Características y arquitectura

Elección de un Programming idioma

Configuración Apache Spark

Creación de una aplicación de ejemplo

Elección del conjunto de datos

Ejecución Data Analysis en los datos

Procesamiento de datos estructurados con Spark SQL

Procesamiento de datos de streaming con Spark Streaming

Integración de Apache Spark con las herramientas de la 3ª parte Machine Learning

Uso de Apache Spark para el procesamiento de gráficos

Optimización Apache Spark

Solución de problemas

Resumen y conclusión

Requerimientos

Experiencia con la línea de comandos de Linux
Una comprensión general del procesamiento de datos
Experiencia en programación con Java, Scala, Python o R

Audiencia

Desarrolladores

21 horas

Testimonios (2)

Compromiso y disposición para explicar temas secundarios.

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Traducción Automática

Experiencia práctica del entrenador, no coloreando la solución discutida pero tampoco introduciendo una característica negativa. Siento que el entrenador me está preparando para un uso real y práctico de la herramienta: estos valiosos detalles generalmente no se encuentran en los libros.

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Traducción Automática

Cursos de Apache Spark Fundamentals

Programa del Curso

Requerimientos

Testimonios (2)

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Cursos Relacionados

Python y Spark para Big Data (PySpark)

Introducción a Graph Computing

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

Apache Spark MLlib

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) para Administradores

Una introducción práctica al procesamiento de flujo

Magellan: Análisis Geoespacial con Spark

Apache Spark for .NET Developers

SMACK Stack for Data Science

Administration of Apache Spark

Apache Spark in the Cloud

Spark para Desarrolladores

Scaling Data Pipelines with Spark NLP

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Cursos de Apache Spark Fundamentals

Programa del Curso

Requerimientos

Testimonios (2)

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Curso - Apache Spark Fundamentals

Cursos Relacionados

Python y Spark para Big Data (PySpark)

Introducción a Graph Computing

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

Apache Spark MLlib

Audiencia

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) para Administradores

Una introducción práctica al procesamiento de flujo

Magellan: Análisis Geoespacial con Spark

Audiencia

Formato del curso

Apache Spark for .NET Developers

SMACK Stack for Data Science

Administration of Apache Spark

Apache Spark in the Cloud

Spark para Desarrolladores

OBJETIVO:

AUDIENCIA

Scaling Data Pipelines with Spark NLP

Categorías Relacionadas

Apache Spark

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites