Programa del Curso

spark.mllib: tipos de datos, algoritmos y utilidades

    Tipos de datos Estadísticas básicas Resumen estadístico Correlaciones Muestreo estratificado Prueba de hipótesis Pruebas de significación de streaming Generación de datos aleatorios
Clasificación y regresión modelos lineales (SVM, regresión logística, regresión lineal)
  • barnalegur Bayes
  • Árboles de decisión
  • conjuntos de árboles (Random Forests y árboles potenciados por gradiente)
  • Regresión isotónica
  • Filtrado colaborativo mínimos cuadrados alternos (ALS)
  • Agrupamiento K-medias
  • Mezcla gaussiana
  • clústeres de iteración de potencia (PIC)
  • Asignación de Dirichlet latente (LDA)
  • Bisección de K-medias
  • Transmisión de K-means
  • Reducción de dimensionalidad descomposición de valores singulares (SVD)
  • análisis de componentes principales (PCA)
  • Extracción y transformación de características
  • Minería de patrones frecuente FP-crecimiento
  • Reglas de la asociación
  • PrefixSpan
  • Métricas de evaluación
  • Exportación de modelos PMML
  • Optimización (desarrollador) Descenso de gradiente estocástico
  • BFGS DE MEMORIA LIMITADA (L-BFGS)
  • spark.ml: API de alto nivel para canalizaciones de ML
  • Resumen: estimadores, transformadores y tuberías Extracción, transformación y selección de entidades Clasificación y regresión Agrupamiento Temas avanzados

    Requerimientos

    Conocimiento de uno de los siguientes:

    • Java
    • Scala
    • pitón
    • SparkR.
     35 horas

    Número de participantes



    Precio por participante

    Testimonios (1)

    Cursos Relacionados

    Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

    21 horas

    Big Data Analytics in Health

    21 horas

    Hadoop and Spark for Administrators

    35 horas

    Hortonworks Data Platform (HDP) para Administradores

    21 horas

    Una introducción práctica al procesamiento de flujo

    21 horas

    Magellan: Análisis Geoespacial con Spark

    14 horas

    Apache Spark for .NET Developers

    21 horas

    SMACK Stack for Data Science

    14 horas

    Apache Spark Fundamentals

    21 horas

    Administration of Apache Spark

    35 horas

    Apache Spark in the Cloud

    21 horas

    Spark para Desarrolladores

    21 horas

    Scaling Data Pipelines with Spark NLP

    14 horas

    Python, Spark, and Hadoop for Big Data

    21 horas

    Apache Spark Streaming with Scala

    21 horas

    Categorías Relacionadas