Glossário IA
O dicionário completo da Inteligência Artificial
Distribuição de Retornos
Representação probabilística completa da soma das recompensas futuras descontadas, capturando o conjunto de todos os cenários possíveis em vez de um único valor esperado.
Distribuição Quantil
Abordagem que modela diretamente os quantis da distribuição de retornos para capturar a variabilidade e as caudas da distribuição das recompensas.
Risco Condicional ao Valor
Medida de risco robusta que calcula a esperança dos retornos na cauda inferior da distribuição, além de um quantil especificado.
Distribuição Implícita
Representação distribucional aprendida indiretamente sem parâmetros explícitos, frequentemente através de redes neurais generativas ou amostradores.
Variância dos Retornos
Medida de dispersão que quantifica o desvio quadrático médio dos retornos em relação à sua esperança, um indicador chave de risco nas decisões.
Entropia da Política
Medida de incerteza sobre as ações do agente, utilizada para explorar o espaço de estados-ações e quantificar a incerteza comportamental.
Limite de Confiança
Intervalos estatísticos que garantem, com uma probabilidade predefinida, que o valor verdadeiro se encontra dentro do intervalo estimado, essenciais para uma exploração segura.
Distribuição Cramer
Família de distribuições flexíveis que permite modelar assimetrias e caudas pesadas nos retornos, indo além das hipóteses gaussianas.
Estimativa por Kernel
Método não-paramétrico para estimar a densidade de probabilidade dos retornos usando funções kernel para suavizar as observações empíricas.
Propagação de incerteza
Processo de transmissão da incerteza através das etapas sucessivas da aprendizagem por reforço, desde as observações até as decisões finais.
Aproximação variacional
Método de otimização que aproxima distribuições complexas por famílias mais simples, minimizando a divergência entre distribuições.
Distribuição de mistura
Combinação ponderada de várias distribuições de base, permitindo capturar comportamentos multimodais nos retornos esperados.
Função de distribuição cumulativa
Função F(x) que dá a probabilidade de que o retorno seja menor ou igual a x, caracterizando completamente a distribuição dos retornos.
Compromisso viés-variância
Dilema fundamental entre a complexidade do modelo (alta variância, baixo viés) e sua simplicidade (baixa variância, alto viés) na estimativa distribucional.