Infraestrutura ML
Inicialização a Frio
Latência inicial observada na primeira requisição a um serviço de inferência serverless ou a um modelo recém-carregado, devido ao tempo de provisionamento de recursos e carregamento do modelo na memória.
← Voltar