Glossário IA
O dicionário completo da Inteligência Artificial
Modelo de Transição Diferenciável
Função matemática descrevendo a evolução do estado de um sistema contínuo, projetada para ser diferenciável a fim de permitir a otimização por descida de gradiente em algoritmos de aprendizado por reforço.
Equações Diferenciais Ordinárias (EDO) Estocásticas
Sistema de equações diferenciais integrando um termo de ruído aleatório, utilizado para modelar a dinâmica incerta de ambientes contínuos mantendo a diferenciabilidade necessária para o aprendizado.
Integrador Numérico Diferenciável
Método de cálculo numérico (ex: Euler, Runge-Kutta) cuja implementação é diferenciável, permitindo propagar os gradientes através das etapas de simulação temporal para a otimização de modelos de dinâmica.
Rede Neural de Função de Base Radial (RBF)
Arquitetura de rede neural utilizando funções de base radial como funções de ativação, particularmente adaptada à aproximação de funções contínuas e diferenciáveis para a modelagem de dinâmicas.
Planejamento por Trajetória Otimizada (TPO)
Método de planejamento no espaço das trajetórias que otimiza diretamente uma sequência de ações utilizando um modelo diferenciável, com atualizações baseadas nos gradientes da recompensa esperada.
Modelagem por Sistemas Hamiltonianos
Abordagem de modelagem da dinâmica contínua baseada nos princípios de conservação de energia dos sistemas hamiltonianos, garantindo propriedades de estabilidade e diferenciabilidade a longo prazo.
Diferenciação Automática através do Tempo
Técnica de cálculo de gradientes que propaga a retropropagação através das etapas temporais de uma simulação contínua, essencial para o treinamento de modelos de dinâmica diferenciáveis.
Modelo Gaussiano de Processo Temporal (TGPM)
Extensão dos processos gaussianos para a modelagem de séries temporais contínuas, oferecendo incerteza calibrada mantendo a diferenciabilidade para a otimização no aprendizado por reforço.
Controlador Neural Diferenciável
Rede neural que implementa uma política de controle cujas saídas são funções diferenciáveis dos estados de entrada, permitindo a otimização conjunta com o modelo de dinâmica em estruturas baseadas em modelo.
Método de Tiro Múltiplo Diferenciável
Algoritmo de resolução de problemas de valor de contorno para sistemas contínuos, adaptado para ser diferenciável e assim permitir a otimização de parâmetros em trajetórias de aprendizado por reforço.
Modelo de Espaço de Estados com Funções de Base
Representação da dinâmica contínua onde as transições de estado são aproximadas por uma combinação linear de funções de base diferenciáveis, facilitando a otimização analítica dos parâmetros do modelo.
Otimização de Política por Modelo Diferenciável (DMPO)
Variante da otimização de política onde os gradientes são calculados através de um modelo de dinâmica diferenciável, combinando as vantagens dos métodos baseados em modelo e sem modelo para ambientes contínuos.
Equação da Dinâmica Aprendida (LDE)
Formulação matemática onde os parâmetros de uma equação diferencial que descreve a dinâmica do sistema são aprendidos por otimização, mantendo a estrutura diferenciável da equação original.
Modelo Híbrido Contínuo-Discreto Diferenciável
Arquitetura de modelagem que combina componentes contínuos diferenciáveis com eventos discretos, onde as transições são suavizadas para manter a diferenciabilidade global do sistema.
Predição de Estado por Integração Diferenciável
Processo de predição de estados futuros utilizando uma integração numérica cuja operação é ela própria diferenciável, permitindo calcular os gradientes da predição em relação aos parâmetros do modelo.
Rede Neural Informada pela Física (PINN)
Arquitetura neural que integra equações diferenciais da física em sua função de perda, garantindo que o modelo aprendido respeite as leis de conservação enquanto permanece diferenciável.
Método de Colocação Diferenciável
Técnica para resolver problemas de otimização restrita para sistemas contínuos, onde as restrições de colocação são formuladas como funções diferenciáveis para o treinamento de políticas.
Modelo de Transição por Equação de Navier-Stokes
Uso das equações de Navier-Stokes, tornadas diferenciáveis por discretização apropriada, para modelar a dinâmica de fluidos em ambientes de aprendizado por reforço contínuos.
Otimização por Lagrangeano Aumentado Diferenciável
Método de otimização restrita onde a função do Lagrangeano aumentado é diferenciável em relação às variáveis de estado e controle, permitindo seu uso em ciclos de aprendizado por reforço.