Infraestrutura ML
Auto-scaling
Capacidade de uma infraestrutura de ajustar dinamicamente o número de recursos de computação (servidores, pods) em função da carga de trabalho, para otimizar os custos e o desempenho dos serviços de inferência.
← Voltar