🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक

एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
📖
शब्द

Post-LN Transformer

Architecture originale de transformeur où la layer normalization est appliquée après les couches d'attention et feed-forward, nécessitant un réglage plus précis du taux d'apprentissage.

📖
शब्द

Gamma et Beta

Paramètres apprenables de la layer normalization permettant respectivement de mettre à l'échelle (scale) et de décaler (shift) les valeurs normalisées pour préserver la puissance de représentation du réseau.

📖
शब्द

Zero Centering

Processus de soustraction de la moyenne des activations dans la layer normalization pour centrer les données autour de zéro, facilitant l'optimisation des gradients.

📖
शब्द

Unit Variance

Standardisation des activations pour avoir une variance unitaire dans la layer normalization, assurant une stabilité numérique et des gradients constants à travers les couches.

📖
शब्द

Gradient Stability

Propriété de la layer normalization qui maintient des gradients stables durant la rétropropagation, évitant les problèmes de gradient explosif ou évanescent dans les transformeurs profonds.

📖
शब्द

Epsilon Parameter

Petite constante ajoutée au dénominateur dans la layer normalization pour éviter la division par zéro et assurer la stabilité numérique lors du calcul de la variance normalisée.

📖
शब्द

Activation Distribution

Distribution des valeurs d'activation dans une couche que la layer normalization maintient constante, facilitant la convergence et l'optimisation des réseaux de transformeurs.

📖
शब्द

Scale Invariance

Propriété de la layer normalization qui rend le modèle insensible aux changements d'échelle des entrées, améliorant la robustesse du modèle face aux variations de données.

📖
शब्द

Training Speed

Accélération significative de l'entraînement des transformeurs grâce à la layer normalization, permettant des taux d'apprentissage plus élevés et une convergence plus rapide.

📖
शब्द

Hidden State Normalization

Application de la layer normalization aux états cachés des transformeurs pour maintenir des activations stables à travers les différentes couches d'encodage et de décodage.

🔍

कोई परिणाम नहीं मिला