Glosario IA
El diccionario completo de la Inteligencia Artificial
Aprendizaje Activo por Refuerzo
Metodología híbrida que combina los principios del aprendizaje activo y del aprendizaje por refuerzo para optimizar la selección de muestras a anotar.
Política de Selección de Muestras
Estrategia determinista o estocástica que define qué datos solicitar anotar para maximizar la mejora del modelo bajo restricción de presupuesto.
Agente de Aprendizaje por Refuerzo
Entidad algorítmica que aprende a tomar decisiones óptimas de selección de muestras mediante la interacción con el entorno de anotación.
Función de Recompensa
Señal que cuantifica la utilidad de cada acción de selección de muestra, típicamente basada en la mejora del rendimiento del modelo.
Estado-Acción-Valor
Función Q(s,a) que estima la recompensa acumulada esperada al seleccionar la acción a desde el estado s y siguiendo la política óptima.
Aprendizaje por Refuerzo Profundo
Extensión del aprendizaje por refuerzo que utiliza redes neuronales profundas para aproximar funciones de valor o políticas.
Aprendizaje Activo Basado en la Incertidumbre
Estrategia en la que el agente selecciona preferentemente las muestras para las cuales el modelo presenta la mayor incertidumbre predictiva.
Selección Estratégica de Muestras
Proceso de decisión optimizado destinado a identificar los subconjuntos de datos que maximizan la ganancia de información por costo de anotación.
Aprendizaje por refuerzo fuera de la política
Método que permite aprender una política óptima siguiendo otra política de comportamiento, útil para la exploración flexible.
Aprendizaje por refuerzo en línea
Paradigma donde el agente aprende y selecciona muestras simultáneamente durante la anotación, adaptando dinámicamente su estrategia.
Equilibrio aprendizaje-anotación
Optimización del compromiso entre el tiempo dedicado a la selección inteligente y las ganancias potenciales en el rendimiento del modelo.
Estrategia de adquisición de datos
Plan de acción sistemático para identificar y recopilar los datos más relevantes para anotar según criterios predefinidos.
Aprendizaje por refuerzo multiagente
Extensión donde varios agentes colaboran o compiten para optimizar conjuntamente la estrategia de selección de muestras.
Algoritmo Q-Learning Activo
Variante del Q-learning adaptada al aprendizaje activo, donde las acciones corresponden a la selección de muestras para anotar.
Política de exploración guiada
Estrategia de exploración orientada hacia las regiones del espacio de datos potencialmente más informativas para el modelo.
Aprendizaje por refuerzo bayesiano
Método que integra la incertidumbre en la estimación de las funciones de valor para una toma de decisiones más robusta en la selección de muestras.