Programa del Curso

Introducción

  • Apache Spark frente a Hadoop MapReduce

Descripción general de Apache Spark Características y arquitectura

Elección de un Programming idioma

Configuración Apache Spark

Creación de una aplicación de ejemplo

Elección del conjunto de datos

Ejecución Data Analysis en los datos

Procesamiento de datos estructurados con Spark SQL

Procesamiento de datos de streaming con Spark Streaming

Integración de Apache Spark con las herramientas de la 3ª parte Machine Learning

Uso de Apache Spark para el procesamiento de gráficos

Optimización Apache Spark

Solución de problemas

Resumen y conclusión

Requerimientos

  • Experiencia con la línea de comandos de Linux
  • Una comprensión general del procesamiento de datos
  • Experiencia en programación con Java, Scala, Python o R

Audiencia

  • Desarrolladores
 21 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Python y Spark para Big Data (PySpark)

21 horas

Introducción a Graph Computing

28 horas

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

21 horas

Apache Spark MLlib

35 horas

Big Data Analytics in Health

21 horas

Hadoop and Spark for Administrators

35 horas

Hortonworks Data Platform (HDP) para Administradores

21 horas

Una introducción práctica al procesamiento de flujo

21 horas

Magellan: Análisis Geoespacial con Spark

14 horas

Apache Spark for .NET Developers

21 horas

SMACK Stack for Data Science

14 horas

Administration of Apache Spark

35 horas

Apache Spark in the Cloud

21 horas

Spark para Desarrolladores

21 horas

Scaling Data Pipelines with Spark NLP

14 horas

Categorías Relacionadas