Programa del Curso

Esquema detallado de la formación

    Introducción a la PNL Entendiendo la PNL Marcos de PNL Aplicaciones comerciales de la PNL Extracción de datos de la web Trabajar con varias API para recuperar datos de texto Trabajar y almacenar corpus de texto guardando contenido y metadatos relevantes Ventajas de usar Python y NLTK curso intensivo Comprensión práctica de un corpus y un conjunto de datos ¿Por qué necesitamos un corpus? Análisis de corpus Tipos de atributos de datos Diferentes formatos de archivo para corpus Preparación de un conjunto de datos para aplicaciones de NLP Comprender la estructura de una oración Componentes de la PNL Comprensión del lenguaje natural Análisis morfológico: raíz, palabra, token, etiquetas de voz Análisis sintáctico Análisis semántico Manejo de la ambigüedad Preprocesamiento de datos de texto Corpus: texto sin procesar Tokenización de oraciones Derivación para texto sin formato Lemización de texto sin formato Eliminación de palabras vacías Sentencias sin corpus Word Tokenización Word Lematización Trabajar con matrices Término-Documento/Documento-Término Tokenización de texto en n-gramas y oraciones Preprocesamiento práctico y personalizado Análisis de datos de texto Característica básica de la PNL Analizadores sintácticos y análisis sintáctico Etiquetado y etiquetadores de puntos de venta Reconocimiento de entidades de nombre N-gramas Bolsa de palabras Características estadísticas de la PNL Conceptos de álgebra lineal para PNL Teoría probabilística de la PNL TF-IDF Vectorización Codificadores y decodificadores Normalización Modelos probabilísticos Ingeniería de características avanzadas y NLP Conceptos básicos de word2vec Componentes del modelo word2vec Lógica del modelo word2vec Extensión del concepto word2vec Aplicación del modelo word2vec Caso práctico: Aplicación de la bolsa de palabras: resumen automático de texto utilizando algoritmos de Luhn simplificados y verdaderos Agrupación de documentos, clasificación y modelado de temas Agrupación en clústeres de documentos y minería de patrones (agrupación jerárquica, k-means, agrupación, etc.) Comparación y clasificación de documentos mediante medidas de distancia TFIDF, Jaccard y coseno Clasificación de documentos utilizando Bayes ingenuo y máxima entropía Identificación de elementos de texto importantes Reducción de la dimensionalidad: Análisis de Componentes Principales, Descomposición de Valores Singulares, factorización de matrices no negativas Modelado de temas y recuperación de información mediante Análisis Semántico Latente Extracción de entidades, análisis de sentimientos y modelado avanzado de temas Positivo vs. negativo: grado de sentimiento Teoría de la respuesta al ítem Etiquetado de partes de la voz y su aplicación: búsqueda de personas, lugares y organizaciones mencionadas en el texto Modelado avanzado de temas: Asignación latente de Dirichlet Casos de estudio Minería no estructurada opiniones de usuarios Clasificación de opiniones y visualización de los datos de reseñas de productos Minería de registros de búsqueda de patrones de uso Clasificación de textos Modelado de temas

Requerimientos

Conocimiento y conciencia de los principios de la PNL y apreciación de la aplicación de la IA en los negocios

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas