Glosario IA
El diccionario completo de la Inteligencia Artificial
231
categorías
2.999
subcategorías
35.535
términos
términos
Modelado de recompensas
Técnica que consiste en modificar la función de recompensa para guiar más eficazmente el aprendizaje del agente. Debe preservar la optimalidad a la vez que acelera la convergencia hacia la solución deseada.
términos
Bandido multi-brazo
Problema de optimización secuencial simplificado donde el agente debe elegir entre varias opciones con recompensas desconocidas. Fundamental para comprender la exploración-explotación en los contextos de optimización.
términos
Meta-aprendizaje en RL
Paradigma donde el agente aprende a aprender, desarrollando capacidades de adaptación rápida a nuevas tareas de optimización. Combina el aprendizaje por refuerzo con los principios del meta-aprendizaje.
🔍