BenchVibe AI Ecosystem

VIP 👤

🏠 Home

Prestatietests

📊 Alle benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List applicaties 🎨 Creatieve vrije pagina's 🎯 FSACB - Ultieme showcase 🌍 Vertaalbenchmark

Modellen

🏆 Top 10 modellen 🆓 Gratis modellen 📋 Alle modellen ⚙️ Kilo Code

Bronnen

💬 Promptbibliotheek 📖 AI-woordenlijst 🔗 Nuttige links

📖

Transformers Multimodaux

Modèle de Vision-Language (VLM)

Classe spécifique de Transformers multimodaux spécialisés dans la compréhension conjointe du texte et des images, utilisés pour des tâches comme la légende d'image, le VQA ou la recherche d'images par texte.

← Terug