Glossário IA
O dicionário completo da Inteligência Artificial
Modelos de Difusão
Arquitetura generativa que utiliza um processo progressivo de adição e remoção de ruído para transformar os dados em ruído puro e depois reconstruir amostras realistas. Esses modelos se destacam na geração de imagens de alta qualidade com uma estabilidade de treinamento superior aos GANs.
Processo de Difusão Direta
Fase de treinamento onde o ruído gaussiano é progressivamente adicionado aos dados originais ao longo de vários passos temporais para atingir uma distribuição de ruído puro. Este processo Markoviano é projetado para ser reversível e matematicamente previsível.
Processo de Difusão Inversa
Fase de geração onde uma rede neural aprende a remover progressivamente o ruído de uma distribuição de ruído puro para reconstruir dados coerentes. Este processo é guiado pela estimativa do gradiente de score da distribuição de dados.
DDPM (Modelos Probabilísticos de Difusão com Desruído)
Classe fundamental de modelos de difusão introduzida por Ho et al. em 2020, utilizando um cronograma de variância linear e um objetivo de previsão de ruído. DDPM estabelece as bases matemáticas para as arquiteturas de difusão modernas.
Cronograma de Ruído
Parametrização temporal que controla a quantidade de ruído adicionada em cada etapa do processo de difusão direta. Um cronograma bem projetado otimiza o equilíbrio entre a preservação da informação e a eficácia da remoção de ruído.
Orientação Sem Classificador
Técnica de controle de geração que combina previsões condicionais e não-condicionais para melhorar a fidelidade ao texto sem a necessidade de um classificador externo. Este método permite um controle fino da geração, preservando a diversidade.
Modelos de Difusão Latente
Arquitetura que otimiza os modelos de difusão trabalhando em um espaço latente comprimido em vez de diretamente no espaço de pixels. Esta abordagem reduz drasticamente os custos computacionais, mantendo uma alta qualidade de geração.
Amostragem Ancestral
Método de amostragem estocástica que combina remoção de ruído determinística e adição controlada de ruído para melhorar a diversidade das amostras geradas. Esta técnica equilibra qualidade e criatividade na geração.
Timesteps de Difusão
Número discreto de etapas usadas no processo de difusão, tipicamente entre 100 e 1000 passos para um equilíbrio ótimo entre qualidade e desempenho. A seleção dos timesteps influencia diretamente a fineza dos detalhes gerados.
U-Net de Desruído
Arquitetura neural com conexões residuais e atenção, especificamente projetada para prever e remover o ruído em cada etapa de difusão. A estrutura U-Net preserva eficazmente as informações espaciais enquanto captura as dependências globais.
Equações Diferenciais Estocásticas
Formulação matemática contínua unificando os processos de difusão direta e inversa em um quadro teórico rigoroso. Esta abordagem permite a análise teórica e o desenvolvimento de novos algoritmos de amostragem.
Difusão Condicional
Extensão dos modelos de difusão que integram condições externas como texto, imagens ou classes para guiar a geração. Esta abordagem permite um controle preciso sobre as características das amostras geradas.
Escala de Orientação (Guidance Scale)
Parâmetro que controla a influência das condições no processo de geração, permitindo ajustar o compromisso entre fidelidade e criatividade. Uma escala alta reforça a adesão às instruções, enquanto uma escala baixa favorece a diversidade.
Reamostragem Progressiva
Técnica de melhoria iterativa que aplica vários ciclos de desruído para refinar os detalhes e corrigir artefatos. Este método otimiza a qualidade final das gerações ao custo de um tempo de cálculo aumentado.
Autoatenção Cruzada (Cross-Attention)
Mecanismo de atenção que permite aos modelos de difusão fundir eficazmente as informações textuais e visuais durante o desruído. Esta arquitetura é crucial para a coerência semântica na geração de texto para imagem.
DDIM (Denoising Diffusion Implicit Models)
Variante determinística dos modelos de difusão que permite uma amostragem acelerada com menos passos, preservando a qualidade. DDIM transforma o processo estocástico em um mapeamento determinístico não-markoviano.