Programa del Curso

Introducción a Speech Recognition y Síntesis

  • Fundamentos de las tecnologías del habla
  • Conceptos básicos de los sistemas de reconocimiento de voz
  • Visión general de la síntesis de voz

Papel de los LLM en las tecnologías del habla

  • Comprender los LLM en el reconocimiento de voz
  • Maestría en Síntesis de Voz
  • Ventajas de los LLM frente a los modelos tradicionales

Datos para Speech Recognition y Síntesis

  • Recopilación y procesamiento de datos para tecnologías del habla
  • Conjuntos de datos de entrenamiento para LLM
  • Consideraciones éticas en el tratamiento de datos

Formación de LLM para aplicaciones de voz

  • Técnicas de aprendizaje profundo en el reconocimiento de voz
  • Arquitecturas de redes neuronales para la síntesis de voz
  • Ajuste fino de los LLM para tareas de voz específicas

Implementación de LLM en sistemas de voz

  • Integración de LLMs con motores de reconocimiento de voz
  • Desarrollo de sintetizadores de voz con sonido natural
  • Diseño de interfaz de usuario para aplicaciones de voz

Pruebas y evaluación de sistemas de voz

  • Métodos para probar la precisión del reconocimiento de voz
  • Evaluación de la naturalidad del habla sintetizada
  • Estudios de usuarios y recopilación de comentarios

Retos y soluciones en las tecnologías del habla

  • Abordar problemas comunes en el reconocimiento de voz
  • Superando obstáculos en la síntesis de voz
  • Casos de estudio: implementaciones exitosas de LLM

Direcciones futuras en las tecnologías del habla

  • Tendencias emergentes en reconocimiento y síntesis de voz
  • El papel de los LLM en los sistemas de voz multilingües
  • Innovaciones y oportunidades de investigación

Proyecto y Evaluación

  • Diseño e implementación de un sistema de reconocimiento o síntesis de voz mediante LLM
  • Revisiones por pares y discusiones grupales
  • Evaluación final y retroalimentación

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos básicos de programación
  • Se recomienda tener experiencia con Python programación, pero no es obligatorio
  • La familiaridad con los conceptos básicos de aprendizaje automático y redes neuronales es beneficiosa

Audiencia

  • Desarrolladores de software
  • Científicos de datos
  • Jefes de producto
 14 horas

Número de participantes



Precio por participante

Cursos Relacionados

Categorías Relacionadas