Procesado del Lenguaje Humano: nuevas
técnicas de procesado de habla y texto

Objetivos

Los principales objetivos del módulo son comprender la complejidad del análisis del lenguaje humano y la lingüística computacional, explorar el potencial de los modelos de lenguaje basado en inteligencia artificial, analizar cómo los modelos de lenguaje están convergiendo con las técnicas de representación del conocimiento y el análisis semántico, presentar las últimas técnicas y avances en procesamiento del habla y el lenguaje natural y proporcionar ejemplos prácticos donde estas técnicas pueden ser aplicadas en casos de estudio reales.

Programa

Este módulo pertenece al programa formativo Avanzado del Aragón EDIH.

1. Explorando la complejidad lingüística: Lingüística Computacional, lenguaje humano y NLP

1.1 Introducción a la lingüística computacional

1.2 Complejidad del análisis y desafíos

1.3 Ejemplos

2. El potencial de los modelos de lenguaje de Inteligencia Artificial

2.1 La irrupción de los Transformers y Large Language Models (LLM)

2.2 Ventajas y Limitaciones

2.3 Ejemplos

3. Convergencia de dos universos: Modelos de Lenguaje (LM) y la representación del conocimiento / semántica

3.1. Extracción automática de conocimiento basada en modelos de lenguaje

3.2 Importancia de la calidad. Desafíos

3.3 Ejemplos

4. Iniciación a las tecnologías del habla: Uso de herramientas de código abierto para el análisis de documentos multimedia.

4.1 Fundamentos de procesado del lenguaje hablado

4.2. Herramientas y Modelos de Deep Learning aplicados a:

Transcripción voz a texto,
Separación de hablantes
Identificación de locutores
Generación de voz

4.3. Taller de uso de herramientas de código abierto para el procesado del audio contenido en documentos multimedia

5. Iniciación a los modelos de lenguaje multimodales

5.1. Fundamentos de los modelos de lenguaje multimodales

5.2 Herramientas y modelos de lenguaje multimodales

5.3 Taller de desarrollo de aplicaciones con CLIP de OpenAI, BLIP, …

A quién va dirigido

El curso estaría dirigido a cualquier persona interesada en adquirir habilidades y conocimientos avanzados en el campo del Procesamiento del habla y el Lenguaje Natural (NLP) y el análisis semántico, y que desee explorar las últimas técnicas y aplicaciones de inteligencia artificial en este campo en constante evolución.

Requisitos

Fundamentos de Inteligencia Artificial: Comprender los conceptos de Aprendizaje Automático, aprendizaje supervisado y no supervisado principalmente. Útil conocer conceptos de Aprendizaje por Refuerzo.
Fundamentos de Deep Learning aplicados a lenguaje: Conceptos básicos de las redes neuronales profundas y su aplicación al campo del lenguaje: feed-foward, LSTM, Transformers.
PLN (Procesamiento del Lenguaje Natural):Conocer las ideas fundamentales sobre el procesado del lenguaje natural; tipos de tareas: audio, texto, clasificación, recuperación de información, chatbots; y problemáticas más habituales: normalización, ambigüedad, idiomas, razonamiento, etc.
Fundamentos de grafos de conocimiento:Conocimientos básicos de grafos de conocimientos y estructuración de la información: RDF, ontología, ...
Python y bibliotecas de Deep Learning: Conocimientos básicos de programación en Python y estar familiarizados con bibliotecas populares de Deep Learning, como Scikit-Learn, Transformers.
Cuenta de gmail, familiarización con el uso de Notebooks/Google Colab
Ordenador propio

Profesorado

Rafael del Hoyo
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
Paula Peña
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
Rosa Montañés
Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
Eduardo Lleida
Catedrático de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza
Antonio Miguel
Profesor Contratado Doctor. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza
Alfonso Ortega
Profesor Titular de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza

Horario, fecha y lugar

- Duración total: 18 horas
- Fechas: Proximamente
- Horario: 16.00 – 19.00 h
- Lugar:
  Instituto Tecnológico de Aragón
  C/ María de Luna, 7 (edificio blanco)
  50018 Zaragoza
- Número máximo de asistentes: 15 personas

Procesado del Lenguaje Humano: nuevastécnicas de procesado de habla y texto

Objetivos

Programa

1. Explorando la complejidad lingüística: Lingüística Computacional, lenguaje humano y NLP

2. El potencial de los modelos de lenguaje de Inteligencia Artificial

3. Convergencia de dos universos: Modelos de Lenguaje (LM) y la representación del conocimiento / semántica

4. Iniciación a las tecnologías del habla: Uso de herramientas de código abierto para el análisis de documentos multimedia.

5. Iniciación a los modelos de lenguaje multimodales

A quién va dirigido

Requisitos

Profesorado

Horario, fecha y lugar

Inscripción

Procesado del Lenguaje Humano: nuevas
técnicas de procesado de habla y texto