Glossário IA
O dicionário completo da Inteligência Artificial
Agrupamento Dinâmico
Técnica de otimização que ajusta automaticamente o tamanho dos lotes de processamento em tempo real para maximizar a utilização dos recursos de hardware e o rendimento geral do sistema.
Tamanho de Lote Adaptativo
Parâmetro variável que modifica dinamicamente o número de amostras processadas simultaneamente, em função da carga da GPU, da memória disponível e da complexidade do modelo.
Otimizador de Rendimento
Algoritmo especializado que analisa continuamente o desempenho do hardware para ajustar os parâmetros de processamento e atingir o rendimento máximo de inferência ou treinamento.
Agendador de Lotes Dinâmico
Componente do sistema que orquestra a distribuição de lotes de dados para as unidades de computação, otimizando o balanceamento de carga e a latência de processamento.
Análise de Recursos em Tempo Real
Monitoramento contínuo das métricas de hardware (utilização de GPU/CPU, largura de banda da memória) para informar as decisões de otimização do agrupamento dinâmico.
Buffer de Agrupamento Fluido
Área de memória intermediária que acumula as requisições de inferência até atingir um tamanho de lote ótimo ou um timeout, permitindo máxima flexibilidade no agrupamento.
Algoritmo de Convergência de Lotes
Método matemático que determina o tamanho de lote ideal em função da curva de desempenho, buscando o ponto ótimo entre latência e rendimento.
Micro-Agrupamento Inteligente
Estratégia de subdivisão de lotes em micro-unidades para paralelizar o processamento em arquiteturas multi-GPU ou distribuídas, mantendo a coerência dos gradientes.
Previsão de Carga de Processamento
Modelo preditivo que antecipa as necessidades de recursos com base nas características dos dados de entrada para pré-ajustar o tamanho de lote ótimo.
Otimização de Largura de Banda de Memória
Técnica complementar ao batching dinâmico que ajusta o tamanho dos lotes para maximizar a utilização da largura de banda de memória e minimizar os gargalos.
Latência Adaptativa por Lote
Métrica de desempenho que mede o tempo de resposta variável em função do tamanho de lote dinâmico, equilibrando velocidade de processamento e tempo de espera.
Balanceamento de Lotes Multi-GPU
Distribuição inteligente dos lotes entre várias GPUs com base nas suas capacidades respetivas e na sua carga atual para uma utilização homogénea.
Limiar de Saturação Dinâmica
Limite calculado automaticamente para além do qual o aumento do tamanho de lote não produz mais ganhos de débito significativos, evitando o desperdício de recursos.
Pipeline de Loteamento Assíncrono
Arquitetura de processamento onde a recolha dos lotes e a sua execução são desacopladas, permitindo um ajuste contínuo sem bloquear o fluxo de dados.
Métrica de Eficiência de Lote
Índice composto que avalia o desempenho do batching dinâmico, combinando débito, utilização de recursos e latência para guiar a otimização contínua.
Controlador de Tamanho de Lote por Reforço
Agente de IA que aprende as políticas ótimas de ajuste do tamanho de lote por tentativa e erro, adaptando-se às mudanças de carga e configuração de hardware.
Fragmentação de Lotes Orientada a Eventos
Fenômeno em que os lotes são subdivididos em resposta a eventos do sistema (picos de carga, liberação de recursos) para manter um desempenho ótimo.
Agregação Temporal de Requisições
Estratégia de agrupamento de requisições de inferência em uma janela temporal deslizante para formar lotes de tamanho ótimo, respeitando as restrições de latência.