Glossário IA
O dicionário completo da Inteligência Artificial
VGAN (Rede Adversarial Generativa de Vídeo)
Modelo pioneiro de GAN para geração de vídeo que decompõe o processo em geração de imagem estática e geração de movimento, utilizando um gerador de imagens e um gerador de movimentos separados.
TGAN (Rede Adversarial Generativa Temporal)
Extensão das GANs que integra uma estrutura RNN (Rede Neural Recorrente) no gerador e no discriminador para modelar explicitamente as dependências temporais em sequências de vídeo.
MoCoGAN (Rede Adversarial Generativa de Movimento e Conteúdo)
Arquitetura que separa a geração de conteúdo (aparência estática) e de movimento (dinâmica temporal) usando geradores distintos, permitindo um melhor controle sobre os elementos de vídeo gerados.
Discriminador 3D
Tipo de discriminador em GANs de vídeo que opera em volumes espaço-temporais (cubos de vídeo) para avaliar simultaneamente a coerência espacial e temporal das sequências geradas.
Gerador de Imagens Condicionais
Componente das GANs de vídeo que gera cada quadro com base na imagem anterior e em um vetor de movimento latente, garantindo a continuidade visual entre as imagens sucessivas.
Fator de Movimento Latente
Variável no espaço latente de uma GAN de vídeo que codifica especificamente as informações de movimento e dinâmica temporal, distinta dos fatores de aparência estática.
Previsão Vídeo-a-Vídeo
Aplicação das GANs de vídeo onde o modelo gera quadros futuros com base em uma sequência de entrada, utilizada para a previsão e extrapolação temporal de vídeos.
Síntese de Vídeo a Partir de Imagens Estáticas
Técnica que utiliza GANs de vídeo para animar imagens estáticas, gerando movimentos plausíveis enquanto preserva a identidade e as características da imagem original.
Coerência Espaço-Temporal
Princípio orientador em GANs de vídeo que garante que objetos e cenas mantenham propriedades consistentes tanto no espaço (dentro de um frame) quanto no tempo (entre os frames).
GAN de Vídeo Hierárquico
Arquitetura multi-escala onde um primeiro GAN gera frames de baixa resolução e um segundo GAN refina os detalhes em alta resolução, melhorando a qualidade e a estabilidade da geração de vídeo.
Discriminador Temporal
Componente especializado em GANs de vídeo que avalia exclusivamente a coerência temporal das sequências, frequentemente usando redes 3D ou arquiteturas recorrentes para analisar as transições entre frames.
Espaço Latente de Vídeo
Representação multidimensional onde cada ponto codifica uma sequência de vídeo completa, permitindo a navegação e interpolação entre diferentes vídeos gerados em um espaço contínuo.
GAN de Vídeo Condicional
Variante de GAN de vídeo que gera sequências baseadas em condições de entrada específicas, como classes de ação, descrições textuais ou trajetórias de movimento predefinidas.
Estabilidade de Treinamento de Vídeo
Desafio importante em GANs de vídeo relacionado à manutenção do equilíbrio entre gerador e discriminador em dados espaço-temporais, exigindo técnicas de otimização especializadas.
GAN de Vídeo Não Supervisionado
Abordagem onde o modelo aprende a gerar vídeos coerentes sem anotações temporais explícitas, descobrindo automaticamente as estruturas de movimento a partir dos dados brutos.
Fator de Aparência Latente
Dimensão no espaço latente de um GAN de vídeo que captura as características estáticas de uma cena, como textura, cor e forma, independentemente das dinâmicas temporais.
GAN de Vídeo de Longa Duração
Arquitetura especializada para gerar sequências de vídeo estendidas, utilizando mecanismos de memória e estruturas hierárquicas para manter a coerência em longos horizontes temporais.