Aprendizaje por Refuerzo Imitativo

📂

subcategorías

Clonación de Comportamiento

Aprendizaje supervisado donde el agente imita directamente las acciones de expertos a partir de demostraciones.

13 términos

📂

subcategorías

Inverse Reinforcement Learning

Infiere la función de recompensa óptima a partir de los comportamientos de expertos observados.

6 términos

📂

subcategorías

Aprendizaje por Imitación Adversarial Generativa

Utiliza redes adversarias para discriminar entre las acciones del agente y las del experto.

12 términos

📂

subcategorías

Agregación de Conjunto de Datos (DAgger)

Método iterativo que recopila nuevos datos de experto sobre las trayectorias del agente para mejorar la política.

19 términos

📂

subcategorías

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 términos

📂

subcategorías

Offline Reinforcement Learning

Aprendizaje por refuerzo utilizando únicamente conjuntos de datos fijos sin interacción con el entorno.

9 términos

📂

subcategorías

Aprendizaje por Imitación Basado en Modelos

Construye un modelo dinámico del entorno para acelerar el aprendizaje por imitación.

10 términos

📂

subcategorías

Meta-Imitation Learning

Apprend à imiter rapidement de nouvelles tâches avec seulement quelques démonstrations.

17 términos

📂

subcategorías

Hierarchical Imitation Learning

Décompose les comportements complexes en une hiérarchie de sous-tâches plus simples à imiter.

10 términos

📂

subcategorías

Aprendizaje por Imitación Multi-Modal

Gestiona múltiples soluciones válidas para una misma tarea aprendiendo una distribución sobre las acciones.

9 términos

📂

subcategorías

Self-Imitation Learning

L'agent imite ses propres actions passées réussies pour améliorer sa politique actuelle.

17 términos

📂

subcategorías

Goal-Conditioned Imitation Learning

Apprend une politique conditionnée par des objectifs spécifiques pour accomplir diverses tâches.

15 términos

📂

subcategorías

Aprendizaje por Refuerzo Inverso Adversarial

Combina IRL con aprendizaje adversarial para una estimación más robusta de las recompensas.

12 términos

📂

subcategorías

Aprendizaje por Imitación con Observaciones Parciales

Aprendizaje por imitación en entornos donde el agente solo observa una parte del estado.

14 términos

📂

subcategorías

Aprendizaje por Imitación con Currículum

Secuencia progresiva de demostraciones de dificultad creciente para facilitar el aprendizaje.

14 términos

Glosario IA

Clonación de Comportamiento

Inverse Reinforcement Learning

Aprendizaje por Imitación Adversarial Generativa

Agregación de Conjunto de Datos (DAgger)

Reward Learning from Human Feedback

Offline Reinforcement Learning

Aprendizaje por Imitación Basado en Modelos

Meta-Imitation Learning

Hierarchical Imitation Learning

Aprendizaje por Imitación Multi-Modal

Self-Imitation Learning

Goal-Conditioned Imitation Learning

Aprendizaje por Refuerzo Inverso Adversarial

Aprendizaje por Imitación con Observaciones Parciales

Aprendizaje por Imitación con Currículum

No se encontraron resultados