RL guiado por la curiosidad

📖

términos

Curiosity-Driven RL

Enfoque de aprendizaje por refuerzo donde el agente genera recompensas intrínsecas basadas en su curiosidad para fomentar la exploración de entornos complejos con recompensas extrínsecas raras.

📖

términos

Intrinsic Motivation

Mecanismo psicológico computacional que impulsa a un agente a actuar para satisfacer necesidades internas como la curiosidad, en lugar de recompensas externas específicas de la tarea.

📖

términos

Prediction Error

Medida de la diferencia entre las predicciones de un modelo del entorno y las observaciones reales, utilizada como señal de curiosidad para fomentar la exploración de estados inesperados.

📖

términos

Intrinsic Curiosity Module (ICM)

Arquitectura neuronal compuesta por modelos de dinámica directa e inversa que genera recompensas intrínsecas basadas en la incertidumbre de predicción para guiar la exploración.

📖

términos

Random Network Distillation (RND)

Método de exploración donde una red neuronal fija y aleatoria se utiliza como objetivo para una red predictora, el error de predicción sirve como recompensa intrínseca para estados novedosos.

📖

términos

Count-Based Exploration

Estrategia de exploración que asigna bonificaciones de curiosidad inversamente proporcionales a la frecuencia de visitación de estados, fomentando así el descubrimiento de regiones menos exploradas.

📖

términos

Pseudo-counts

Estimación aproximada de las frecuencias de visitación de estados en espacios continuos o de alta dimensión, utilizada para implementar bonificaciones de curiosidad basadas en conteo.

📖

términos

Empowerment

Medida informacional que cuantifica el control que un agente ejerce sobre su entorno, maximizada para fomentar comportamientos exploratorios que aumenten la influencia del agente.

📖

términos

Ganancia de Información

Cantidad de información nueva adquirida por el agente sobre el entorno, utilizada como señal intrínseca para dirigir la exploración hacia las regiones más informativas.

📖

términos

Curiosidad Episódica

Enfoque de curiosidad basado en la memoria a corto plazo donde el agente está motivado a visitar estados diferentes de los observados recientemente en el episodio actual.

📖

términos

Exploración por Maximización Variacional de Información (VIME)

Método de exploración que maximiza la información mutua entre los parámetros del modelo y las observaciones futuras, utilizando enfoques bayesianos para cuantificar la incertidumbre.

📖

términos

Conteo de Visitas de Estado

Contador del número de veces que un estado particular ha sido visitado, utilizado para calcular bonificaciones de exploración que favorecen el descubrimiento de estados raros o no explorados.

📖

términos

Exploración Guiada por Curiosidad

Paradigma de exploración donde el agente es guiado por recompensas intrínsecas basadas en la novedad o la sorpresa, en lugar de por estrategias de exploración aleatorias predefinidas.

📖

términos

Curiosidad de Toda la Vida

Capacidad de un agente para mantener una motivación exploratoria a lo largo de largos períodos, adaptando continuamente sus comportamientos para descubrir nuevos conocimientos en entornos cambiantes.

📖

términos

Detección de Novedad

Proceso de identificación de observaciones o estados significativamente diferentes de las experiencias pasadas, sirviendo como base para generar señales de curiosidad.

📖

términos

Algoritmo de exploración que memoriza explícitamente los estados visitados con las trayectorias correspondientes, y luego explora sistemáticamente desde estos puntos de anclaje para descubrir nuevas regiones.

Glosario IA

Curiosity-Driven RL

Intrinsic Motivation

Prediction Error

Intrinsic Curiosity Module (ICM)

Random Network Distillation (RND)

Count-Based Exploration

Pseudo-counts

Empowerment

Ganancia de Información

Curiosidad Episódica

Exploración por Maximización Variacional de Información (VIME)

Conteo de Visitas de Estado

Exploración Guiada por Curiosidad

Curiosidad de Toda la Vida

Detección de Novedad

Go-Explore

No se encontraron resultados