🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles
📖
Quantification et Optimisation

Inférence Spécifique (Speculative Inference)

Technique d'accélération de l'inférence générative où un petit modèle 'draft' propose rapidement plusieurs tokens, qui sont ensuite validés en parallèle par le grand modèle cible, réduisant le nombre total d'étapes de calcul coûteuses.

← Retour