Aprendizaje Activo por Refuerzo

📖

términos

Aprendizaje Activo por Refuerzo

Metodología híbrida que combina los principios del aprendizaje activo y del aprendizaje por refuerzo para optimizar la selección de muestras a anotar.

📖

términos

Política de Selección de Muestras

Estrategia determinista o estocástica que define qué datos solicitar anotar para maximizar la mejora del modelo bajo restricción de presupuesto.

📖

términos

Agente de Aprendizaje por Refuerzo

Entidad algorítmica que aprende a tomar decisiones óptimas de selección de muestras mediante la interacción con el entorno de anotación.

📖

términos

Función de Recompensa

Señal que cuantifica la utilidad de cada acción de selección de muestra, típicamente basada en la mejora del rendimiento del modelo.

📖

términos

Estado-Acción-Valor

Función Q(s,a) que estima la recompensa acumulada esperada al seleccionar la acción a desde el estado s y siguiendo la política óptima.

📖

términos

Aprendizaje por Refuerzo Profundo

Extensión del aprendizaje por refuerzo que utiliza redes neuronales profundas para aproximar funciones de valor o políticas.

📖

términos

Aprendizaje Activo Basado en la Incertidumbre

Estrategia en la que el agente selecciona preferentemente las muestras para las cuales el modelo presenta la mayor incertidumbre predictiva.

📖

términos

Selección Estratégica de Muestras

Proceso de decisión optimizado destinado a identificar los subconjuntos de datos que maximizan la ganancia de información por costo de anotación.

📖

términos

Aprendizaje por refuerzo fuera de la política

Método que permite aprender una política óptima siguiendo otra política de comportamiento, útil para la exploración flexible.

📖

términos

Aprendizaje por refuerzo en línea

Paradigma donde el agente aprende y selecciona muestras simultáneamente durante la anotación, adaptando dinámicamente su estrategia.

📖

términos

Equilibrio aprendizaje-anotación

Optimización del compromiso entre el tiempo dedicado a la selección inteligente y las ganancias potenciales en el rendimiento del modelo.

📖

términos

Estrategia de adquisición de datos

Plan de acción sistemático para identificar y recopilar los datos más relevantes para anotar según criterios predefinidos.

📖

términos

Aprendizaje por refuerzo multiagente

Extensión donde varios agentes colaboran o compiten para optimizar conjuntamente la estrategia de selección de muestras.

📖

términos

Algoritmo Q-Learning Activo

Variante del Q-learning adaptada al aprendizaje activo, donde las acciones corresponden a la selección de muestras para anotar.

📖

términos

Política de exploración guiada

Estrategia de exploración orientada hacia las regiones del espacio de datos potencialmente más informativas para el modelo.

📖

términos

Aprendizaje por refuerzo bayesiano

Método que integra la incertidumbre en la estimación de las funciones de valor para una toma de decisiones más robusta en la selección de muestras.

Glosario IA