Mixed Precision Computing
FP8 (8-bit Floating Point)
Format émergent de représentation sur 8 bits avec différentes variantes (E4M3, E5M2) optimisées pour l'entraînement et l'inférence, offrant un compromis extrême entre débit et précision pour les très grands modèles.
← ফিরে যান