AI-ordlista

Den kompletta ordlistan över AI

162

kategorier

2 032

underkategorier

23 060

termer

📖

termer

Masked Image Modeling (MIM)

Technique d'apprentissage auto-supervisé où des parties d'images sont masquées et le modèle apprend à les reconstruire en utilisant uniquement le contexte visuel environnant.

📖

termer

Vision Transformer (ViT)

Architecture neuronale qui applique les mécanismes d'attention des Transformers aux images en les divisant en patches séquentiels pour le traitement.

📖

termer

Mask Token

Token spécial utilisé dans MIM pour indiquer les positions masquées que le modèle doit prédire, similaire au [MASK] en NLP.

📖

termer

Token Prediction

Tâche fondamentale de prédire les tokens visuels manquants basée sur les tokens visuels contextuels non masqués dans l'image.

📖

termer

Contextual Learning

Capacité du modèle à comprendre les relations spatiales et sémantiques entre les patches d'image pour améliorer la prédiction des régions masquées.

📖

termer

Patch Masking Strategy

Stratégie définissant quelles régions de l'image masquer (pourcentage, distribution spatiale) pour optimiser l'apprentissage des représentations.

📖

termer

Visual Context

Ensemble des informations visuelles environnantes utilisées pour inférer le contenu des régions masquées dans une image.

📖

termer

Downstream Task

Tâche spécifique (classification, segmentation, détection) où les représentations apprises via MIM sont appliquées après le pré-entraînement.

🔍

AI-ordlista

Masked Image Modeling (MIM)

Vision Transformer (ViT)

Mask Token

Token Prediction

Contextual Learning

Patch Masking Strategy

Visual Context

Downstream Task

Inga resultat hittades