Procesado del Lenguaje Humano: nuevas
técnicas de procesado de habla y texto

 

Objetivos

Los principales objetivos del módulo son comprender la complejidad del análisis del lenguaje humano y la lingüística computacional, explorar el potencial de los modelos de lenguaje basado en inteligencia artificial, analizar cómo los modelos de lenguaje están convergiendo con las técnicas de representación del conocimiento y el análisis semántico, presentar las últimas técnicas y avances en procesamiento del habla y el lenguaje natural y proporcionar ejemplos prácticos donde estas técnicas pueden ser aplicadas en casos de estudio reales.

Programa

Este módulo pertenece al programa formativo Avanzado del Aragón EDIH.

1. Explorando la complejidad lingüística: Lingüística Computacional, lenguaje humano y NLP

1.1 Introducción a la lingüística computacional

1.2 Complejidad del análisis y desafíos 

1.3 Ejemplos

2. El potencial de los modelos de lenguaje de Inteligencia Artificial

2.1 La irrupción de los Transformers y Large Language Models (LLM)

2.2 Ventajas y Limitaciones

2.3 Ejemplos

3. Convergencia de dos universos: Modelos de Lenguaje (LM) y la representación del conocimiento / semántica

3.1. Extracción automática de conocimiento basada en modelos de lenguaje

3.2 Importancia de la calidad. Desafíos

3.3 Ejemplos

4. Iniciación a las tecnologías del habla: Uso de herramientas de código abierto para el análisis de documentos multimedia.

4.1 Fundamentos de procesado del lenguaje hablado

4.2. Herramientas y Modelos de Deep Learning aplicados a:

  • Transcripción voz a texto,
  • Separación de hablantes
  • Identificación de locutores
  • Generación de voz

4.3. Taller de uso de herramientas de código abierto para el procesado del audio contenido en documentos multimedia

5. Iniciación a los modelos de lenguaje multimodales

5.1. Fundamentos de los modelos de lenguaje multimodales

5.2 Herramientas y modelos de lenguaje multimodales

5.3 Taller de desarrollo de aplicaciones con CLIP de OpenAI, BLIP, …

A quién va dirigido

El curso estaría dirigido a cualquier persona interesada en adquirir habilidades y conocimientos avanzados en el campo del Procesamiento del habla y el Lenguaje Natural (NLP) y el análisis semántico, y que desee explorar las últimas técnicas y aplicaciones de inteligencia artificial en este campo en constante evolución.

Requisitos

  • Fundamentos de Inteligencia Artificial: Comprender los conceptos de Aprendizaje Automático, aprendizaje supervisado y no supervisado principalmente. Útil conocer conceptos de Aprendizaje por Refuerzo.
  • Fundamentos de Deep Learning aplicados a lenguaje: Conceptos básicos de las redes neuronales profundas y su aplicación al campo del lenguaje: feed-foward, LSTM, Transformers.
  • PLN (Procesamiento del Lenguaje Natural):Conocer las ideas fundamentales sobre el procesado del lenguaje natural; tipos de tareas: audio, texto, clasificación, recuperación de información, chatbots; y problemáticas más habituales: normalización, ambigüedad, idiomas, razonamiento, etc.
  • Fundamentos de grafos de conocimiento:Conocimientos básicos de grafos de conocimientos y estructuración de la información: RDF, ontología, ...
  • Python y bibliotecas de Deep Learning: Conocimientos básicos de programación en Python y estar familiarizados con bibliotecas populares de Deep Learning, como Scikit-Learn, Transformers.
  • Cuenta de gmail, familiarización con el uso de Notebooks/Google Colab
  • Ordenador propio

Profesorado

  • Rafael del Hoyo
    Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
  • Paula Peña
    Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
  • Rosa Montañés
    Equipo Big Data y Sistemas Cognitivos del Instituto Tecnológico de Aragón
  • Eduardo Lleida
    Catedrático de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza
  • Antonio Miguel
    Profesor Contratado Doctor. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza
  • Alfonso Ortega
    Profesor Titular de Universidad. Vivolab, Instituto de Investigación en Ingeniería de Aragón, I3A, Universidad de Zaragoza

Horario, fecha y lugar

    • Duración total: 18 horas
    • Fechas:  Febrero 2025
    • Horario: 16.00 – 19.00 h
    • Lugar:
      Instituto Tecnológico de Aragón
      C/ María de Luna, 7 (edificio blanco)
      50018 Zaragoza
    • Número máximo de asistentes: 15 personas
  •  

Inscripción