Procesado del Lenguaje Humano: nuevas
técnicas de procesado de habla y texto
Objetivos
Los principales objetivos del módulo son comprender la complejidad del análisis del lenguaje humano y la lingüística computacional, explorar el potencial de los modelos de lenguaje basado en inteligencia artificial, analizar cómo los modelos de lenguaje están convergiendo con las técnicas de representación del conocimiento y el análisis semántico, presentar las últimas técnicas y avances en procesamiento del habla y el lenguaje natural y proporcionar ejemplos prácticos donde estas técnicas pueden ser aplicadas en casos de estudio reales.
Programa
Este módulo pertenece al programa formativo Avanzado del Aragón EDIH.
1. Explorando la complejidad lingüística: Lingüística Computacional, lenguaje humano y NLP
1.1 Introducción a la lingüística computacional
1.2 Complejidad del análisis y desafíos
1.3 Ejemplos
2. El potencial de los modelos de lenguaje de Inteligencia Artificial
2.1 La irrupción de los Transformers y Large Language Models (LLM)
2.2 Ventajas y Limitaciones
2.3 Ejemplos
3. Convergencia de dos universos: Modelos de Lenguaje (LM) y la representación del conocimiento / semántica
3.1. Extracción automática de conocimiento basada en modelos de lenguaje
3.2 Importancia de la calidad. Desafíos
3.3 Ejemplos
4. Iniciación a las tecnologías del habla: Uso de herramientas de código abierto para el análisis de documentos multimedia.
4.1 Fundamentos de procesado del lenguaje hablado
4.2. Herramientas y Modelos de Deep Learning aplicados a:
- Transcripción voz a texto,
- Separación de hablantes
- Identificación de locutores
- Generación de voz
4.3. Taller de uso de herramientas de código abierto para el procesado del audio contenido en documentos multimedia
5. Iniciación a los modelos de lenguaje multimodales
5.1. Fundamentos de los modelos de lenguaje multimodales
5.2 Herramientas y modelos de lenguaje multimodales
5.3 Taller de desarrollo de aplicaciones con CLIP de OpenAI, BLIP, …
A quién va dirigido
El curso estaría dirigido a cualquier persona interesada en adquirir habilidades y conocimientos avanzados en el campo del Procesamiento del habla y el Lenguaje Natural (NLP) y el análisis semántico, y que desee explorar las últimas técnicas y aplicaciones de inteligencia artificial en este campo en constante evolución.
Requisitos
- Fundamentos de Inteligencia Artificial: Comprender los conceptos de Aprendizaje Automático, aprendizaje supervisado y no supervisado principalmente. Útil conocer conceptos de Aprendizaje por Refuerzo.
- Fundamentos de Deep Learning aplicados a lenguaje: Conceptos básicos de las redes neuronales profundas y su aplicación al campo del lenguaje: feed-foward, LSTM, Transformers.
- PLN (Procesamiento del Lenguaje Natural):Conocer las ideas fundamentales sobre el procesado del lenguaje natural; tipos de tareas: audio, texto, clasificación, recuperación de información, chatbots; y problemáticas más habituales: normalización, ambigüedad, idiomas, razonamiento, etc.
- Fundamentos de grafos de conocimiento:Conocimientos básicos de grafos de conocimientos y estructuración de la información: RDF, ontología, ...
- Python y bibliotecas de Deep Learning: Conocimientos básicos de programación en Python y estar familiarizados con bibliotecas populares de Deep Learning, como Scikit-Learn, Transformers.
- Cuenta de gmail, familiarización con el uso de Notebooks/Google Colab
- Ordenador propio
Profesorado
- Rafael del Hoyo
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón - Paula Peña
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón - Rosa Montañés
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón - Eduardo Lleida
Catedrático de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza - Antonio Miguel
Profesor Contratado Doctor. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza - Alfonso Ortega
Profesor Titular de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza
Horario, fecha y lugar
- Duración total: 18 horas
- Fechas: 1, 2, 3, 8, 9 y 10 octubre
- Horario: 16.00 – 19.00 h
- Lugar:
Instituto Tecnológico de Aragón
C/ María de Luna, 7 (edificio blanco)
50018 Zaragoza - Número máximo de asistentes: 15 personas