Computación con GPU para IA
CUDA Graphs
Tecnología que permite capturar una secuencia completa de operaciones CUDA en un grafo, y luego reejecutarla con una sobrecarga mínima, reduciendo los costos de lanzamiento de núcleos para cargas de trabajo repetitivas.
← Volver