Glosario IA
El diccionario completo de la Inteligencia Artificial
Curiosity-Driven RL
Enfoque de aprendizaje por refuerzo donde el agente genera recompensas intrínsecas basadas en su curiosidad para fomentar la exploración de entornos complejos con recompensas extrínsecas raras.
Intrinsic Motivation
Mecanismo psicológico computacional que impulsa a un agente a actuar para satisfacer necesidades internas como la curiosidad, en lugar de recompensas externas específicas de la tarea.
Prediction Error
Medida de la diferencia entre las predicciones de un modelo del entorno y las observaciones reales, utilizada como señal de curiosidad para fomentar la exploración de estados inesperados.
Intrinsic Curiosity Module (ICM)
Arquitectura neuronal compuesta por modelos de dinámica directa e inversa que genera recompensas intrínsecas basadas en la incertidumbre de predicción para guiar la exploración.
Random Network Distillation (RND)
Método de exploración donde una red neuronal fija y aleatoria se utiliza como objetivo para una red predictora, el error de predicción sirve como recompensa intrínseca para estados novedosos.
Count-Based Exploration
Estrategia de exploración que asigna bonificaciones de curiosidad inversamente proporcionales a la frecuencia de visitación de estados, fomentando así el descubrimiento de regiones menos exploradas.
Pseudo-counts
Estimación aproximada de las frecuencias de visitación de estados en espacios continuos o de alta dimensión, utilizada para implementar bonificaciones de curiosidad basadas en conteo.
Empowerment
Medida informacional que cuantifica el control que un agente ejerce sobre su entorno, maximizada para fomentar comportamientos exploratorios que aumenten la influencia del agente.
Ganancia de Información
Cantidad de información nueva adquirida por el agente sobre el entorno, utilizada como señal intrínseca para dirigir la exploración hacia las regiones más informativas.
Curiosidad Episódica
Enfoque de curiosidad basado en la memoria a corto plazo donde el agente está motivado a visitar estados diferentes de los observados recientemente en el episodio actual.
Exploración por Maximización Variacional de Información (VIME)
Método de exploración que maximiza la información mutua entre los parámetros del modelo y las observaciones futuras, utilizando enfoques bayesianos para cuantificar la incertidumbre.
Conteo de Visitas de Estado
Contador del número de veces que un estado particular ha sido visitado, utilizado para calcular bonificaciones de exploración que favorecen el descubrimiento de estados raros o no explorados.
Exploración Guiada por Curiosidad
Paradigma de exploración donde el agente es guiado por recompensas intrínsecas basadas en la novedad o la sorpresa, en lugar de por estrategias de exploración aleatorias predefinidas.
Curiosidad de Toda la Vida
Capacidad de un agente para mantener una motivación exploratoria a lo largo de largos períodos, adaptando continuamente sus comportamientos para descubrir nuevos conocimientos en entornos cambiantes.
Detección de Novedad
Proceso de identificación de observaciones o estados significativamente diferentes de las experiencias pasadas, sirviendo como base para generar señales de curiosidad.
Go-Explore
Algoritmo de exploración que memoriza explícitamente los estados visitados con las trayectorias correspondientes, y luego explora sistemáticamente desde estos puntos de anclaje para descubrir nuevas regiones.