Glossário IA
O dicionário completo da Inteligência Artificial
Teste A/B para Modelos
Técnica de implantação comparativa onde duas versões de um modelo são testadas simultaneamente em segmentos de usuários distintos para avaliar seus desempenhos relativos em condições reais.
Inferência Online
Modo de inferência em tempo real onde o modelo processa as previsões individuais sob demanda com latência mínima, tipicamente através de APIs REST ou gRPC.
Inferência em Lote
Abordagem de inferência onde as previsões são geradas para lotes de dados em intervalos regulares, otimizada para o throughput em vez da latência individual.
Inferência Serverless
Arquitetura de implantação onde a infraestrutura de computação é gerenciada automaticamente pelo provedor de nuvem, com cobrança por uso e escalabilidade automática baseada na demanda.
Implantação de Edge AI
Implantação de modelos ML em dispositivos de borda (edge devices) para executar a inferência localmente, reduzindo a latência e a dependência da rede enquanto preserva a confidencialidade dos dados.
Serving de Modelo
Infraestrutura e processos que permitem expor os modelos ML através de endpoints API para inferência em produção, incluindo carregamento, gerenciamento do ciclo de vida e otimização.
Autoescalabilidade para ML
Mecanismo de adaptação dinâmica dos recursos de computação com base na carga de inferência, utilizando métricas específicas como número de requisições ou latência.
Observabilidade de Modelo
Capacidade de entender o estado interno e o comportamento dos modelos em produção através de logs, métricas e traces detalhados para debugging e otimização.
Implantação Gradual
Estratégia de implantação controlada onde a exposição do novo modelo aumenta progressivamente (10%, 25%, 50%, 100%) com validação em cada etapa.
Serialização de Modelo
Processo de conversão do modelo treinado em formato armazenável e transportável (Pickle, ONNX, SavedModel) para implantação e inferência em produção.
Pipeline de Inferência
Sequência de etapas de processamento aplicadas aos dados de entrada antes e depois da previsão do modelo, incluindo pré-processamento, inferência e pós-processamento.