🏠 Startseite
Vergleiche
📊 Alle Benchmarks 🦖 Dinosaurier v1 🦖 Dinosaurier v2 ✅ To-Do-Listen-Apps 🎨 Kreative freie Seiten 🎯 FSACB - Ultimatives Showcase 🌍 Übersetzungs-Benchmark
Modelle
🏆 Top 10 Modelle 🆓 Kostenlose Modelle 📋 Alle Modelle ⚙️ Kilo Code
Ressourcen
💬 Prompt-Bibliothek 📖 KI-Glossar 🔗 Nützliche Links

KI-Glossar

Das vollständige Wörterbuch der Künstlichen Intelligenz

162
Kategorien
2.032
Unterkategorien
23.060
Begriffe
📖
Begriffe

Image Patches

Division d'une image en grilles régulières de petites sections carrées (typiquement 16x16 pixels) qui sont traitées comme des tokens séquentiels par le ViT.

📖
Begriffe

Tokenization Visuelle

Processus de segmentation d'une image en séquence de tokens discrets, fondamental pour adapter l'architecture transformer conçue initialement pour le texte aux données visuelles.

📖
Begriffe

DeiT (Data-efficient Image Transformer)

Variante de Vision Transformer entraînée avec des stratégies de distillation pour atteindre des performances compétitives avec moins de données d'entraînement.

📖
Begriffe

Hierarchical Vision Transformers

Architectures transformer qui maintiennent des représentations multi-échelles de l'image, combinant les avantages des CNN traditionnels avec la flexibilité des transformers.

📖
Begriffe

Layer Scaling

Technique de normalisation appliquée aux résidus dans les couches transformer pour stabiliser l'entraînement et améliorer la convergence des modèles profonds.

📖
Begriffe

Cross-Attention Vision Transformer

Architecture utilisant des mécanismes d'attention croisée entre différentes modalités ou représentations, permettant des interactions plus riches entre features.

📖
Begriffe

Window-based Self-Attention

Variante d'attention restreinte à des fenêtres locales而非 l'image complète, réduisant la complexité computationnelle tout en capturant les relations locales importantes.

🔍

Keine Ergebnisse gefunden