Multimodal Contrastive Learning - مسرد الذكاء الاصطناعي

📂

الفئات الفرعية

CLIP (Contrastive Language-Image Pre-training)

Architecture révolutionnaire qui apprend des représentations visuelles et textuelles partagées en utilisant 400 millions de paires image-texte.

6 المصطلحات

📂

الفئات الفرعية

ALIGN (A Large-scale ImaGe and Noisy-text Embedding)

Approche alternative à CLIP utilisant un dataset bruité de 1.8 milliards de paires image-texte d'Internet sans filtrage.

12 المصطلحات

📂

الفئات الفرعية

SimCLR (Simple Contrastive Learning)

Méthode fondamentale d'apprentissage contrastif simple qui utilise des augmentations fortes et des projecteurs pour apprendre des représentations.

8 المصطلحات

📂

الفئات الفرعية

MoCo (Momentum Contrast)

Technique utilisant une queue de mémoire avec mise à jour par momentum pour maintenir un grand nombre de paires négatives.

11 المصطلحات

📂

الفئات الفرعية

BYOL (Bootstrap Your Own Latent)

Approche innovante éliminant le besoin d'échantillons négatifs en utilisant deux réseaux avec mise à jour par momentum.

7 المصطلحات

📂

الفئات الفرعية

InfoNCE Loss

Fonction de perte fondamentale pour l'apprentissage contrastif basée sur l'estimation par contraste de bruit.

4 المصطلحات

📂

الفئات الفرعية

Triplet Loss

Méthode contrastive utilisant des triplets (ancre, positif, négatif) pour apprendre des représentations discriminatives.

7 المصطلحات

📂

الفئات الفرعية

Cross-Modal Retrieval

Application principale permettant de rechercher des données d'une modalité à partir d'une requête d'une autre modalité.

8 المصطلحات

📂

الفئات الفرعية

Multimodal Data Augmentation

Techniques d'augmentation spécifiques coordonnées entre différentes modalités pour créer des paires positives robustes.

20 المصطلحات

📂

الفئات الفرعية

Vision Transformers in Contrastive Learning

Application des architectures Transformer à l'apprentissage contrastif pour des représentations visuelles puissantes.

9 المصطلحات

📂

الفئات الفرعية

Hard Negative Mining

Stratégie pour identifier et utiliser les échantillons négatifs les plus difficiles pour améliorer l'apprentissage contrastif.

6 المصطلحات

📂

الفئات الفرعية

Temperature Scaling

Paramètre crucial contrôlant la concentration de la distribution dans les fonctions de perte contrastives.

4 المصطلحات

📂

الفئات الفرعية

Multimodal Fusion Strategies

Approches différentes pour combiner des informations de plusieurs modalités avant ou après le contraste.

12 المصطلحات

📂

الفئات الفرعية

Self-Supervised Pre-training

Utilisation de l'apprentissage contrastif pour pré-entraîner des modèles sans annotations supervisées.

1 المصطلحات

📂

الفئات الفرعية

Contrastive Learning for Audio-Text

Extension des méthodes contrastives aux paires audio-texte pour des applications comme la transcription et la recherche audio.

15 المصطلحات

قاموس الذكاء الاصطناعي

CLIP (Contrastive Language-Image Pre-training)

ALIGN (A Large-scale ImaGe and Noisy-text Embedding)

SimCLR (Simple Contrastive Learning)

MoCo (Momentum Contrast)

BYOL (Bootstrap Your Own Latent)

InfoNCE Loss

Triplet Loss

Cross-Modal Retrieval

Multimodal Data Augmentation

Vision Transformers in Contrastive Learning

Hard Negative Mining

Temperature Scaling

Multimodal Fusion Strategies

Self-Supervised Pre-training

Contrastive Learning for Audio-Text

لم يتم العثور على نتائج