Cursos de Apache Spark in the Cloud

La curva de aprendizaje de Apache Spark está aumentando lentamente al principio, necesita mucho esfuerzo para obtener el primer retorno. Este curso tiene como objetivo saltar a través de la primera parte difícil. Después de tomar este curso, los participantes comprenderán los conceptos básicos de Apache Spark , diferenciarán claramente RDD de DataFrame, aprenderán Python y Scala API, comprenderán ejecutores y tareas, etc. Además, siguiendo las mejores prácticas, este curso se enfoca fuertemente en implementación en la nube, Databricks y AWS. Los estudiantes también comprenderán las diferencias entre AWS EMR y AWS Glue, uno de los últimos servicios Spark de AWS.

AUDIENCIA:

Ingeniero de Datos, DevOps , Científico de Datos

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Programa del Curso

Introducción:

Apache Spark en el ecosistema Hadoop
Breve introducción para python, scala

Conceptos básicos (teoría):

Arquitectura
RDD
Transformación y Acciones
Etapa, tarea, dependencias

Uso del entorno Databricks comprender los conceptos básicos (taller práctico):

Ejercicios con RDD API
Funciones básicas de acción y transformación
PairRDD
Juntar
Estrategias de almacenamiento en caché
Ejercicios con la API de DataFrame
ChispaSQL
DataFrame: seleccionar, filtrar, agrupar, ordenar
UDF (Función definida por el usuario)
Examinando la API de DataSet
Streaming

Uso del entorno de AWS Comprender la implementación (taller práctico):

Conceptos básicos de AWS Glue
Comprender las diferencias entre AWS EMR yAWS Glue
Ejemplos de trabajos en ambos entornos
Comprender los pros y los contras

Extra:

Introducción a laorquestación Apache Airflow

Requerimientos

Habilidades de programación (preferiblemente python, scala)

SQL Conceptos básicos

21 horas

Testimonios (2)

Having hands on session / assignments

Poornima Chenthamarakshan - Intelligent Medical Objects

Curso - Apache Spark in the Cloud

1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise

Cursos de Apache Spark in the Cloud

Programa del Curso

Requerimientos

Testimonios (2)

Poornima Chenthamarakshan - Intelligent Medical Objects

Curso - Apache Spark in the Cloud

Steven Wu - Intelligent Medical Objects

Curso - Apache Spark in the Cloud

Cursos Relacionados

Python y Spark para Big Data (PySpark)

Introducción a Graph Computing

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

Apache Spark MLlib

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) para Administradores

Una introducción práctica al procesamiento de flujo

Magellan: Análisis Geoespacial con Spark

Apache Spark for .NET Developers

SMACK Stack for Data Science

Apache Spark Fundamentals

Administration of Apache Spark

Spark para Desarrolladores

Scaling Data Pipelines with Spark NLP

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Cursos de Apache Spark in the Cloud

Programa del Curso

Requerimientos

Testimonios (2)

Poornima Chenthamarakshan - Intelligent Medical Objects

Curso - Apache Spark in the Cloud

Steven Wu - Intelligent Medical Objects

Curso - Apache Spark in the Cloud

Cursos Relacionados

Python y Spark para Big Data (PySpark)

Introducción a Graph Computing

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

Apache Spark MLlib

Audiencia

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) para Administradores

Una introducción práctica al procesamiento de flujo

Magellan: Análisis Geoespacial con Spark

Audiencia

Formato del curso

Apache Spark for .NET Developers

SMACK Stack for Data Science

Apache Spark Fundamentals

Administration of Apache Spark

Spark para Desarrolladores

OBJETIVO:

AUDIENCIA

Scaling Data Pipelines with Spark NLP

Categorías Relacionadas

Apache Spark

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites