Glosarium AI
Kamus lengkap Kecerdasan Buatan
VGAN (Video Generative Adversarial Network)
Modèle pionnier de GAN pour la génération vidéo qui décompose le processus en génération d'image statique et génération de mouvement, utilisant un générateur d'images et un générateur de mouvements séparés.
TGAN (Temporal Generative Adversarial Network)
Extension des GANs qui intègre une structure RNN (Recurrent Neural Network) dans le générateur et le discriminateur pour modéliser explicitement les dépendances temporelles dans les séquences vidéo.
MoCoGAN (Motion and Content Generative Adversarial Network)
Architecture qui sépare la génération de contenu (apparence statique) et de mouvement (dynamique temporelle) en utilisant des générateurs distincts, permettant un meilleur contrôle sur les éléments vidéo générés.
Discriminateur 3D
Type de discriminateur dans les GANs vidéo qui opère sur des volumes spatio-temporels (cubes vidéo) pour évaluer simultanément la cohérence spatiale et temporelle des séquences générées.
Générateur d'Images Conditionnelles
Composant des GANs vidéo qui génère chaque frame en se basant sur l'image précédente et un vecteur de mouvement latent, assurant la continuité visuelle entre les images successives.
Facteur de Mouvement Latent
Variable dans l'espace latent d'un GAN vidéo qui encode spécifiquement les informations de mouvement et de dynamique temporelle, distincte des facteurs d'apparence statique.
Prédiction Vidéo-à-Vidéo
Application des GANs vidéo où le modèle génère des frames futures en se basant sur une séquence d'entrée, utilisée pour la prédiction et l'extrapolation temporelle de vidéos.
Synthèse de Vidéo à Partir d'Images Fixes
Technique utilisant des GANs vidéo pour animer des images statiques en générant des mouvements plausibles tout en préservant l'identité et les caractéristiques de l'image originale.
Coherence Spatio-Temporelle
Principe directeur dans les GANs vidéo assurant que les objets et scènes maintiennent des propriétés cohérentes à la fois dans l'espace (à l'intérieur d'une frame) et dans le temps (entre les frames).
GAN Vidéo Hiérarchique
Architecture multi-échelle où un premier GAN génère des frames à basse résolution et un second GAN affine les détails à haute résolution, améliorant la qualité et la stabilité de la génération vidéo.
Discriminateur Temporel
Composant spécialisé dans les GANs vidéo qui évalue exclusivement la cohérence temporelle des séquences, souvent en utilisant des réseaux 3D ou des architectures récurrentes pour analyser les transitions entre frames.
Espace Latent Vidéo
Représentation multidimensionnelle où chaque point encode une séquence vidéo complète, permettant la navigation et l'interpolation entre différentes vidéos générées dans un espace continu.
GAN Vidéo Conditionnel
Variante de GAN vidéo qui génère des séquences basées sur des conditions d'entrée spécifiques comme des classes d'action, des descriptions textuelles ou des trajectoires de mouvement prédéfinies.
Stabilité d'Entraînement Vidéo
Défi majeur dans les GANs vidéo lié au maintien de l'équilibre entre générateur et discriminateur sur des données spatio-temporelles, nécessitant des techniques d'optimisation spécialisées.
GAN Vidéo sans Supervision
Approche où le modèle apprend à générer des vidéos cohérentes sans annotations temporelles explicites, en découvrant automatiquement les structures de mouvement à partir des données brutes.
Facteur d'Apparence Latent
Dimension dans l'espace latent d'un GAN vidéo qui capture les caractéristiques statiques d'une scène comme la texture, la couleur et la forme, indépendamment des dynamiques temporelles.
GAN Vidéo à Longue Durée
Architecture spécialisée pour générer des séquences vidéo étendues en utilisant des mécanismes de mémoire et des structures hiérarchiques pour maintenir la cohérence sur de longs horizons temporels.