🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Función de Covarianza

Función núcleo que define la similitud entre puntos en un proceso gaussiano, determinando la estructura de correlación y las propiedades de suavizado del modelo.

📖
términos

GP-MDP

Proceso de decisión de Markov donde las recompensas o transiciones son modeladas por procesos gaussianos, integrando la incertidumbre en la formulación del problema de RL.

📖
términos

Muestreo de Thompson con GP

Método de muestreo de acciones basado en extracciones del proceso gaussiano posterior, permitiendo la exploración guiada por la incertidumbre.

📖
términos

GP-SARSA

Variante del algoritmo SARSA que utiliza procesos gaussianos para modelar la función de valor Q con incertidumbre en el aprendizaje por refuerzo.

📖
términos

Kernel RBF

Función de base radial gaussiana utilizada como covarianza en los GP, asegurando la continuidad y diferenciabilidad de las funciones modeladas.

📖
términos

GPQ

Función Q aproximada por proceso gaussiano, permitiendo cuantificar la incertidumbre sobre las estimaciones de valor en el aprendizaje por refuerzo.

📖
términos

GP-PILCO

Framework de RL que utiliza procesos gaussianos para aprender la dinámica del sistema con propagación analítica de la incertidumbre.

📖
términos

Bandido Contextual con GP

Problema de bandido donde las recompensas dependen de un contexto, modelado por procesos gaussianos para capturar la incertidumbre espacial.

📖
términos

GP-MCTS

Búsqueda en Árbol Monte Carlo utilizando procesos gaussianos para evaluar los nodos con incertidumbre, mejorando la búsqueda en RL.

📖
términos

GP-MAE

Máximo a Posteriori con estimación de la incertidumbre mediante procesos gaussianos para la estimación de políticas en aprendizaje por refuerzo.

🔍

No se encontraron resultados