🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis
📖
Quantificação e Otimização

Inferência Especulativa (Speculative Inference)

Técnica de aceleração da inferência generativa onde um pequeno modelo 'rascunho' propõe rapidamente vários tokens, que são então validados em paralelo pelo grande modelo alvo, reduzindo o número total de etapas de cálculo custosas.

← Voltar