Aprendizaje por Imitación Multimodal

📖

términos

Aprendizaje por Imitación Multimodal

Paradigma de aprendizaje donde el agente aprende a partir de demostraciones que presentan múltiples soluciones válidas para una misma tarea, capturando la diversidad de los comportamientos de expertos.

📖

términos

Distribución de Políticas Multimodales

Representación probabilística de una política que contiene múltiples modos distintos, cada uno correspondiendo a una estrategia de resolución diferente para alcanzar el mismo objetivo.

📖

términos

Modo de Acción

Configuración comportamental específica dentro de una distribución multimodal, representando una manera distinta y coherente de ejecutar una tarea.

📖

términos

Agregación de Demostraciones

Proceso de combinación inteligente de trayectorias de aprendizaje provenientes de diferentes estrategias para construir una política unificada preservando la multimodalidad.

📖

términos

Mezcla de Gaussianas para Políticas

Modelo paramétrico que representa una política multimodal como una combinación ponderada de múltiples distribuciones gaussianas, cada gaussiana correspondiendo a un modo comportamental.

📖

términos

Posterior de Trayectoria

Distribución condicional sobre las trayectorias posibles dado un estado inicial y el objetivo, capturando la incertidumbre sobre las diferentes maneras de alcanzar el objetivo.

📖

términos

Espacio Latente Comportamental

Representación comprimida donde cada punto codifica una estrategia comportamental distinta, permitiendo la navegación e interpolación entre diferentes modos de acción.

📖

términos

Clustering de Demostraciones

Técnica de agrupamiento automático de trayectorias similares para identificar e aislar los diferentes modos comportamentales presentes en los datos de imitación.

📖

términos

Desacoplamiento Modalidad-Acción

Arquitectura donde la selección del modo comportamental y la generación de acciones específicas son tratadas por componentes separados para una mejor modelización multimodal.

📖

términos

Inferencia de Modo

Proceso de identificación del modo comportamental apropiado a utilizar en una situación dada, basado en el contexto y las preferencias del agente.

📖

términos

Política Condicional

Política que genera acciones condicionadas tanto por el estado actual como por un identificador de modo seleccionado, permitiendo un control explícito de la estrategia adoptada.

📖

términos

Selección de Solución Óptima

Mecanismo que evalúa y elige la mejor solución entre varias alternativas válidas basado en criterios como la eficiencia, la robustez o las restricciones contextuales.

📖

términos

Varianza Comportamental

Medida estadística que cuantifica la dispersión de las acciones o trayectorias alrededor de cada modo, distinguiendo la variabilidad intra-modo de la multimodalidad.

📖

términos

Fusión de Modos

Técnica que combina varios modos comportamentales para crear nuevas estrategias híbridas, explotando las fortalezas de cada modo individual.

📖

términos

Aprendizaje de Subpolíticas

Enfoque donde cada modo es modelado como una subpolítica especializada, aprendida independientemente antes de ser integrada en una arquitectura multimodal global.

📖

términos

Jerarquía de Soluciones

Estructura organizacional de las diferentes soluciones válidas, a menudo basada en su complejidad, eficiencia o contexto de aplicación óptimo.

📖

términos

Exploración Guiada por Modo

Estrategia de exploración que mantiene la coherencia con un modo de comportamiento seleccionado mientras descubre nuevas variaciones válidas dentro de este modo.

📖

términos

Transferencia Inter-modal

Capacidad de transferir conocimientos adquiridos en un modo de comportamiento para mejorar el aprendizaje o la ejecución en otro modo similar.

📖

términos

Evaluación Multimodal

Métrica de evaluación que considera no solo el rendimiento promedio sino también la cobertura y la calidad de los diferentes modos de comportamiento aprendidos.

Glosario IA