Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
162
categorie
2.032
sottocategorie
23.060
termini
termini
Projection Matrices
Matrices de poids apprenables Wq, Wk, Wv transformant les embeddings d'entrée en espaces Query, Key, Value, et Wo combinant les sorties de différentes têtes d'attention.
termini
Pre-LN Transformer
Variante d'architecture où la normalisation de couche est appliquée avant l'attention et le feed-forward plutôt qu'après, offrant une meilleure stabilité d'entraînement pour les modèles profonds.
🔍