Glosario IA
El diccionario completo de la Inteligencia Artificial
Bandidos Multi-brazos Clásicos
Problema fundamental donde el agente elige entre varias opciones para maximizar la recompensa acumulativa.
Algoritmos Epsilon-Voraces
Estrategia que explota la mejor acción conocida con probabilidad 1-ε y explora aleatoriamente con probabilidad ε.
Algoritmos UCB
Métodos basados en los límites superiores de confianza que equilibran exploración y explotación mediante intervalos estadísticos.
Muestreo de Thompson
Enfoque bayesiano que muestrea parámetros según su distribución posterior para tomar decisiones.
Bandidos Contextuales
Extensión donde las decisiones dependen de características contextuales observadas en cada ronda.
Bandidos Lineales
Modelos donde la recompensa esperada es una función lineal de las características contextuales.
Bandidos No Estacionarios
Marco donde las distribuciones de recompensa cambian con el tiempo, requiriendo una adaptación continua.
Bandidos Combinatorios
Problemas donde el agente selecciona conjuntos de acciones simultáneamente con restricciones estructurales.
Bandidos Adversarios
Escenario donde un adversario elige las recompensas para minimizar la ganancia del agente.
Bandidos en Cascada
Modelo donde los ítems se presentan secuencialmente hasta que el usuario hace clic en uno de ellos.
Bandidos con Retroalimentación Limitada
Situaciones en las que solo se observa información parcial sobre las recompensas después de cada acción.
Bandidos para Publicidad Online
Aplicación específica para la optimización de campañas publicitarias en tiempo real.
Bandidos para Pruebas A/B
Alternativa inteligente a las pruebas A/B tradicionales para la optimización de experiencias web.
Bandidos para Recomendaciones
Sistemas que aprenden las preferencias del usuario para personalizar las recomendaciones.
Bandidos Jerárquicos
Estructuras multinivel donde las decisiones se organizan en una jerarquía para problemas complejos.