🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Función de Valor Multi-Objetivo

Extensión vectorial de la función de valor clásica que estima los retorno esperados para cada objetivo considerado separadamente. Permite la evaluación simultánea del rendimiento de una política según múltiples criterios.

📖
términos

Política de Equilibrio

Estrategia de decisión que mantiene un compromiso estable entre diferentes objetivos antagónicos a lo largo del tiempo. Representa una solución duradera en entornos donde los objetivos entran en conflicto.

📖
términos

Vector de Recompensa

Estructura de datos multidimensional que contiene los valores de recompensa para cada objetivo en cada paso de interacción. Constituye el elemento fundamental de retroalimentación en los sistemas MORL.

📖
términos

Frontera de Pareto

Conjunto completo de soluciones no dominadas que representan todos los compromisos óptimos posibles entre objetivos. Visualiza el espacio de soluciones candidatas en el aprendizaje por refuerzo multi-objetivo.

📖
términos

Política Estocástica Multi-Objetivos

Distribución de probabilidades sobre las acciones que optimiza simultáneamente múltiples objetivos según diferentes pesos. Permite la exploración de compromisos variados entre objetivos durante la toma de decisiones.

📖
términos

Hiperplano de Ponderación

Subespacio vectorial que define los pesos relativos asignados a cada objetivo en la escalarización. Determina la orientación de la optimización en el espacio multi-objetivos.

📖
términos

Espacios de Acción Multi-Objetivos

Estructuras donde cada acción puede tener impactos diferentes en cada objetivo considerado. Requieren algoritmos especializados para gestionar la complejidad de las decisiones multi-criterio.

📖
términos

Aprendizaje por Refuerzo Escalarizado

Paradigma que transforma el problema multi-objetivos en serie de problemas mono-objetivos mediante diferentes escalarizaciones. Permite el uso de algoritmos estándar para descubrir el conjunto de Pareto.

📖
términos

Optimización Convexa Multi-Objetivo

Clase de problemas donde las funciones objetivo son convexas, garantizando propiedades teóricas fuertes sobre las soluciones óptimas. Facilita la convergencia y el análisis de políticas multi-objetivo.

📖
términos

Métrica de Hipervolumen

Indicador de rendimiento que mide el volumen del espacio objetivo dominado por un conjunto de soluciones. Permite la comparación cuantitativa de conjuntos de políticas multi-objetivo.

📖
términos

Política Contextual Multi-Objetivo

Enfoque donde los pesos de los objetivos dependen del contexto o del estado del entorno. Permite una adaptación fina de los compromisos según las situaciones encontradas.

🔍

No se encontraron resultados