AI-ordlista

Den kompletta ordlistan över AI

162

kategorier

2 032

underkategorier

23 060

termer

📖

termer

Modality Alignment

Processus d'entraînement visant à aligner les espaces de représentation de différentes modalités dans un espace vectoriel commun pour faciliter les transferts cross-modaux.

📖

termer

Perceiver

Architecture Transformer généraliste capable de traiter des données arbitraires multimodales en utilisant un mécanisme d'attention cross-attention entre entrées et bottleneck latent.

📖

termer

Unified Multimodal Pre-training

Approche pré-entraînant un seul modèle sur multiples tâches et modalités simultanément pour obtenir des représentations plus générales et transférables.

📖

termer

Image Captioning Transformer

Architecture encoder-décodeur Transformer générant automatiquement des descriptions textuelles descriptives et cohérentes pour des images d'entrée.

📖

termer

Audio-Visual Transformer

Modèle Transformer traitant simultanément les flux audio et vidéo pour des tâches comme la reconnaissance audiovisuelle ou la génération synchronisée.

📖

termer

Video Transformer

Variante de Vision Transformer adaptée au traitement séquentiel des frames vidéo incorporant des informations temporelles via l'attention spatio-temporelle.

📖

termer

Transformer-based Multimodal Fusion

Technique utilisant les mécanismes d'attention des Transformers pour fusionner intelligemment les caractéristiques de multiples modalités au niveau sémantique.

🔍

AI-ordlista

Modality Alignment

Perceiver

Unified Multimodal Pre-training

Image Captioning Transformer

Audio-Visual Transformer

Video Transformer

Transformer-based Multimodal Fusion

Inga resultat hittades