Glossário IA
O dicionário completo da Inteligência Artificial
Conjunto de Retenção
Subconjunto dos dados mantido separadamente e não utilizado durante o treinamento do modelo para avaliar objetivamente seu desempenho final. Este conjunto permanece totalmente isolado até a avaliação final para evitar qualquer contaminação de informação.
Teste no Mundo Real
Fase de validação onde o modelo é implantado em condições operacionais reais para avaliar seu desempenho em seu contexto natural de uso. Este teste frequentemente revela comportamentos inesperados não observados durante as validações em laboratório.
Teste de Produção
Processo de validação contínua dos modelos após sua implantação em produção para monitorar seu desempenho e detectar qualquer degradação. Esta etapa é essencial para manter a confiabilidade dos sistemas de IA em um ambiente operacional.
Teste em Modo Sombra
Método de validação onde um novo modelo é executado em paralelo com o sistema de produção sem afetar as decisões finais, permitindo comparar seu desempenho com o modelo atual. Esta abordagem minimiza os riscos durante a avaliação de novas versões.
Validação Temporal
Estratégia de validação que respeita a ordem cronológica dos dados, utilizando apenas dados passados para o treinamento e dados futuros para o teste. Esta abordagem simula as condições reais de implantação e evita o vazamento de informação temporal.
Validação Geográfica
Validação externa onde o modelo é testado em dados provenientes de regiões geográficas diferentes daquelas utilizadas para o treinamento. Esta técnica é crucial para avaliar a capacidade de generalização espacial dos modelos.
Mudança de População
Mudança nas características demográficas ou estatísticas da população-alvo entre o treinamento e a implantação do modelo. Este fenômeno pode afetar significativamente o desempenho e a equidade das previsões.
Validação Ambiental
Teste do modelo em condições ambientais variadas (luz, ruído, temperatura) para avaliar sua robustez a fatores externos. Esta validação é particularmente importante para sistemas de visão e sensores IoT.
Validação Multissítio
Avaliação do desempenho de um modelo em dados coletados de vários locais ou instituições distintas para testar sua generalizabilidade. Esta abordagem é padrão na área médica para garantir a validade dos modelos de diagnóstico.