🏠 Startseite
Vergleiche
📊 Alle Benchmarks 🦖 Dinosaurier v1 🦖 Dinosaurier v2 ✅ To-Do-Listen-Apps 🎨 Kreative freie Seiten 🎯 FSACB - Ultimatives Showcase 🌍 Übersetzungs-Benchmark
Modelle
🏆 Top 10 Modelle 🆓 Kostenlose Modelle 📋 Alle Modelle ⚙️ Kilo Code
Ressourcen
💬 Prompt-Bibliothek 📖 KI-Glossar 🔗 Nützliche Links

KI-Glossar

Das vollständige Wörterbuch der Künstlichen Intelligenz

162
Kategorien
2.032
Unterkategorien
23.060
Begriffe
📖
Begriffe

Vision Transformers (ViT)

Architecture neuronale qui applique les transformeurs originellement conçus pour le NLP aux tâches de vision en divisant les images en patches séquentiels.

📖
Begriffe

Rotation Prediction

Tâche prétexte où le modèle doit prédire l'angle de rotation appliqué à une image, apprenant ainsi des représentations sensibles à l'orientation spatiale.

📖
Begriffe

Jigsaw Puzzle Solving

Méthode prétexte qui consiste à diviser une image en patches et à entraîner le modèle à réassembler les pièces dans le bon ordre spatial.

📖
Begriffe

SwAV

Swapped Prediction, méthode combinant apprentissage contrastif et clustering online pour assigner des représentations cohérentes entre différentes vues augmentées.

📖
Begriffe

Masked Autoencoders (MAE)

Architecture auto-supervisée masquant un pourcentage élevé de patches d'images et reconstruisant uniquement les pixels manquants, non les patches visibles.

📖
Begriffe

IBOT

Image BERT Pre-Training avec Online Tokenizer, combinant masked image modeling et distillation de connaissance pour des pré-entraînements robustes.

📖
Begriffe

Data2Vec

Framework unifié d'apprentissage auto-supervisé pour vision, audio et texte basé sur la prédiction de représentations latentes plutôt que de pixels ou tokens.

📖
Begriffe

Local-Global Contrastive Learning

Approche contrastive établissant des correspondances entre les caractéristiques locales et globales pour capturer des représentations multi-échelles cohérentes.

📖
Begriffe

Cross-Correlation Matrix Optimization

Technique directly optimizing the cross-correlation matrix between augmented view representations to optimally align embeddings.

🔍

Keine Ergebnisse gefunden