🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
📖
Descenso de Gradiente Estocástico

RAdam

Variante rectificada de Adam que corrige la varianza de los pesos adaptativos durante las fases iniciales de calentamiento del entrenamiento. RAdam combina las ventajas teóricas de SGD con el rendimiento práctico de Adam, ofreciendo una convergencia más estable al principio del entrenamiento.

← Volver