Programa del Curso
Introducción
- Comprender la importancia de la preparación de datos en la analítica y el aprendizaje automático
- La canalización de preparación de datos y su papel en el ciclo de vida de los datos
- Explorar los desafíos comunes de los datos sin procesar y el impacto en el análisis
Recopilación y adquisición de datos
- Fuentes de datos: bases de datos, API, hojas de cálculo, archivos de texto, etc.
- Técnicas para recopilar datos y garantizar la calidad de los datos durante la recopilación
- Recopilación de datos de diversas fuentes
Data Cleaning Técnicas
- Identificación y control de valores faltantes, valores atípicos e incoherencias
- Tratar con duplicados y errores en el conjunto de datos
- Limpieza de conjuntos de datos del mundo real
Transformación y estandarización de datos
- Técnicas de normalización y estandarización de datos
- Manejo de datos categóricos: codificación, agrupación e ingeniería de características
- Transformación de datos sin procesar en formatos utilizables
Data Integration y Agregación
- Fusión y combinación de conjuntos de datos de diferentes fuentes
- Resolución de conflictos de datos y alineación de tipos de datos
- Técnicas de agregación y consolidación de datos
Data Quality Seguros
- Métodos para garantizar la calidad e integridad de los datos a lo largo de todo el proceso
- Implementación de controles de calidad y procedimientos de validación
- Casos prácticos y aplicaciones prácticas del aseguramiento de la calidad de los datos
Reducción de dimensionalidad y selección de características
- Comprender la necesidad de reducir la dimensionalidad
- Técnicas como PCA, selección de características y estrategias de reducción
- Implementación de técnicas de reducción de dimensionalidad
Resumen y próximos pasos
Requerimientos
-
Comprensión básica de los conceptos de datos
Audiencia
-
Analistas de datos
Database Administradores
Profesionales de TI
Testimonios (4)
The variety of the information shared and the clarity to explain terms in plain English.
Arisbe Mendoza - Fairtrade International
Curso - GDPR Workshop
Conocimiento, formación ejemplar
Krzysztof Kantorski - Santander
Curso - Oracle GoldenGate
Traducción Automática
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curso - Talend Open Studio for ESB
La capacidad de Engauge en una base 1: 1 y asegurarme de que tenía claridad y comprensión sobre los conceptos discutidos.
Dave - Sea
Curso - Data Architecture Fundamentals
Traducción Automática