Glosario IA
El diccionario completo de la Inteligencia Artificial
Clonaje Conductual
Aprendizaje directo de una política minimizando el error entre las acciones del agente y las demostraciones expertas.
Aprendizaje por Refuerzo Inverso
Inferencia de la función de recompensa a partir de las demostraciones expertas para luego aprender la política óptima.
Aprendizaje por Imitación Adversarial Generativo
Uso de redes antagónicas para distinguir los comportamientos del agente de las demostraciones expertas.
Agregación de Datos DAgger
Recopilación iterativa de datos interrogando al experto sobre los estados visitados por la política actual.
Aprendizaje por Imitación Offline
Aprendizaje a partir de un conjunto fijo de demostraciones sin interacción adicional con el entorno.
Aprendizaje por Imitación en Línea
Aprendizaje continuo con interacción en tiempo real y actualizaciones basadas en las nuevas demostraciones.
Imitación por Observación
Aprendizaje observando únicamente los estados y trayectorias sin tener acceso a las acciones del experto.
Aprendizaje por Imitación Jerárquica
Descomposición de tareas complejas en subtareas con aprendizaje por imitación a diferentes niveles de abstracción.
Aprendizaje por Imitación en Un Solo Tiro
Capacidad de imitar una nueva tarea después de observar una sola demostración.
Meta-Aprendizaje por Imitación
Aprendizaje para aprender rápidamente nuevas tareas por imitación a través de la experiencia en múltiples tareas.
Aprendizaje por Imitación Multimodal
Gestión de demostraciones con múltiples soluciones válidas y aprendizaje de políticas multimodales.
Imitación con Observaciones Parciales
Aprendizaje por imitación cuando las demostraciones cubren solo parcialmente el espacio de estados.