Glosario IA
El diccionario completo de la Inteligencia Artificial
Aprendizaje por Imitación Multimodal
Paradigma de aprendizaje donde el agente aprende a partir de demostraciones que presentan múltiples soluciones válidas para una misma tarea, capturando la diversidad de los comportamientos de expertos.
Distribución de Políticas Multimodales
Representación probabilística de una política que contiene múltiples modos distintos, cada uno correspondiendo a una estrategia de resolución diferente para alcanzar el mismo objetivo.
Modo de Acción
Configuración comportamental específica dentro de una distribución multimodal, representando una manera distinta y coherente de ejecutar una tarea.
Agregación de Demostraciones
Proceso de combinación inteligente de trayectorias de aprendizaje provenientes de diferentes estrategias para construir una política unificada preservando la multimodalidad.
Mezcla de Gaussianas para Políticas
Modelo paramétrico que representa una política multimodal como una combinación ponderada de múltiples distribuciones gaussianas, cada gaussiana correspondiendo a un modo comportamental.
Posterior de Trayectoria
Distribución condicional sobre las trayectorias posibles dado un estado inicial y el objetivo, capturando la incertidumbre sobre las diferentes maneras de alcanzar el objetivo.
Espacio Latente Comportamental
Representación comprimida donde cada punto codifica una estrategia comportamental distinta, permitiendo la navegación e interpolación entre diferentes modos de acción.
Clustering de Demostraciones
Técnica de agrupamiento automático de trayectorias similares para identificar e aislar los diferentes modos comportamentales presentes en los datos de imitación.
Desacoplamiento Modalidad-Acción
Arquitectura donde la selección del modo comportamental y la generación de acciones específicas son tratadas por componentes separados para una mejor modelización multimodal.
Inferencia de Modo
Proceso de identificación del modo comportamental apropiado a utilizar en una situación dada, basado en el contexto y las preferencias del agente.
Política Condicional
Política que genera acciones condicionadas tanto por el estado actual como por un identificador de modo seleccionado, permitiendo un control explícito de la estrategia adoptada.
Selección de Solución Óptima
Mecanismo que evalúa y elige la mejor solución entre varias alternativas válidas basado en criterios como la eficiencia, la robustez o las restricciones contextuales.
Varianza Comportamental
Medida estadística que cuantifica la dispersión de las acciones o trayectorias alrededor de cada modo, distinguiendo la variabilidad intra-modo de la multimodalidad.
Fusión de Modos
Técnica que combina varios modos comportamentales para crear nuevas estrategias híbridas, explotando las fortalezas de cada modo individual.
Aprendizaje de Subpolíticas
Enfoque donde cada modo es modelado como una subpolítica especializada, aprendida independientemente antes de ser integrada en una arquitectura multimodal global.
Jerarquía de Soluciones
Estructura organizacional de las diferentes soluciones válidas, a menudo basada en su complejidad, eficiencia o contexto de aplicación óptimo.
Exploración Guiada por Modo
Estrategia de exploración que mantiene la coherencia con un modo de comportamiento seleccionado mientras descubre nuevas variaciones válidas dentro de este modo.
Transferencia Inter-modal
Capacidad de transferir conocimientos adquiridos en un modo de comportamiento para mejorar el aprendizaje o la ejecución en otro modo similar.
Evaluación Multimodal
Métrica de evaluación que considera no solo el rendimiento promedio sino también la cobertura y la calidad de los diferentes modos de comportamiento aprendidos.