🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📂
subcategorías

Clonación de Comportamiento

Aprendizaje supervisado donde el agente imita directamente las acciones de expertos a partir de demostraciones.

13 términos
📂
subcategorías

Inverse Reinforcement Learning

Infiere la función de recompensa óptima a partir de los comportamientos de expertos observados.

6 términos
📂
subcategorías

Aprendizaje por Imitación Adversarial Generativa

Utiliza redes adversarias para discriminar entre las acciones del agente y las del experto.

12 términos
📂
subcategorías

Agregación de Conjunto de Datos (DAgger)

Método iterativo que recopila nuevos datos de experto sobre las trayectorias del agente para mejorar la política.

19 términos
📂
subcategorías

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 términos
📂
subcategorías

Offline Reinforcement Learning

Aprendizaje por refuerzo utilizando únicamente conjuntos de datos fijos sin interacción con el entorno.

9 términos
📂
subcategorías

Aprendizaje por Imitación Basado en Modelos

Construye un modelo dinámico del entorno para acelerar el aprendizaje por imitación.

10 términos
📂
subcategorías

Meta-Imitation Learning

Apprend à imiter rapidement de nouvelles tâches avec seulement quelques démonstrations.

17 términos
📂
subcategorías

Hierarchical Imitation Learning

Décompose les comportements complexes en une hiérarchie de sous-tâches plus simples à imiter.

10 términos
📂
subcategorías

Aprendizaje por Imitación Multi-Modal

Gestiona múltiples soluciones válidas para una misma tarea aprendiendo una distribución sobre las acciones.

9 términos
📂
subcategorías

Self-Imitation Learning

L'agent imite ses propres actions passées réussies pour améliorer sa politique actuelle.

17 términos
📂
subcategorías

Goal-Conditioned Imitation Learning

Apprend une politique conditionnée par des objectifs spécifiques pour accomplir diverses tâches.

15 términos
📂
subcategorías

Aprendizaje por Refuerzo Inverso Adversarial

Combina IRL con aprendizaje adversarial para una estimación más robusta de las recompensas.

12 términos
📂
subcategorías

Aprendizaje por Imitación con Observaciones Parciales

Aprendizaje por imitación en entornos donde el agente solo observa una parte del estado.

14 términos
📂
subcategorías

Aprendizaje por Imitación con Currículum

Secuencia progresiva de demostraciones de dificultad creciente para facilitar el aprendizaje.

14 términos
🔍

No se encontraron resultados