قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
CLIP (Contrastive Language-Image Pre-training)
Architecture révolutionnaire qui apprend des représentations visuelles et textuelles partagées en utilisant 400 millions de paires image-texte.
ALIGN (A Large-scale ImaGe and Noisy-text Embedding)
Approche alternative à CLIP utilisant un dataset bruité de 1.8 milliards de paires image-texte d'Internet sans filtrage.
SimCLR (Simple Contrastive Learning)
Méthode fondamentale d'apprentissage contrastif simple qui utilise des augmentations fortes et des projecteurs pour apprendre des représentations.
MoCo (Momentum Contrast)
Technique utilisant une queue de mémoire avec mise à jour par momentum pour maintenir un grand nombre de paires négatives.
BYOL (Bootstrap Your Own Latent)
Approche innovante éliminant le besoin d'échantillons négatifs en utilisant deux réseaux avec mise à jour par momentum.
InfoNCE Loss
Fonction de perte fondamentale pour l'apprentissage contrastif basée sur l'estimation par contraste de bruit.
Triplet Loss
Méthode contrastive utilisant des triplets (ancre, positif, négatif) pour apprendre des représentations discriminatives.
Cross-Modal Retrieval
Application principale permettant de rechercher des données d'une modalité à partir d'une requête d'une autre modalité.
Multimodal Data Augmentation
Techniques d'augmentation spécifiques coordonnées entre différentes modalités pour créer des paires positives robustes.
Vision Transformers in Contrastive Learning
Application des architectures Transformer à l'apprentissage contrastif pour des représentations visuelles puissantes.
Hard Negative Mining
Stratégie pour identifier et utiliser les échantillons négatifs les plus difficiles pour améliorer l'apprentissage contrastif.
Temperature Scaling
Paramètre crucial contrôlant la concentration de la distribution dans les fonctions de perte contrastives.
Multimodal Fusion Strategies
Approches différentes pour combiner des informations de plusieurs modalités avant ou après le contraste.
Self-Supervised Pre-training
Utilisation de l'apprentissage contrastif pour pré-entraîner des modèles sans annotations supervisées.
Contrastive Learning for Audio-Text
Extension des méthodes contrastives aux paires audio-texte pour des applications comme la transcription et la recherche audio.