🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📖
termes

Pile d'Encodeurs

Empilement de couches identiques transformant la séquence d'entrée en représentations riches et contextuelles, chaque couche contenant attention et feed-forward.

📖
termes

Pile de Décodeurs

Architecture composée de couches générant la séquence de sortie, utilisant l'attention masquée pour prévenir les fuites d'informations futures et l'attention croisée avec l'encodeur.

📖
termes

Attention Encodeur-Décodeur

Mécanisme permettant au décodeur d'accéder et de se concentrer sur les représentations de l'encodeur pour générer chaque token de sortie de manière informée.

📖
termes

Normalisation de Couche

Technique de stabilisation de l'entraînement normalisant les activations pour chaque position, appliquée avant ou après les sous-couches dans l'architecture transformer.

📖
termes

Auto-Attention Masquée

Variante de l'auto-attention utilisée dans les décodeurs où les positions futures sont masquées pour prévenir l'utilisation d'informations non disponibles lors de la génération.

📖
termes

Attention Produit Scalaire Mis à l'Échelle

Calcul d'attention normalisant les produits scalaires par la racine carrée de la dimension des clés pour stabiliser les gradients lors de l'entraînement.

📖
termes

Têtes d'Attention

Sous-espaces indépendants dans l'attention multi-têtes, chacun apprenant à se concentrer sur différents types de relations et motifs dans les données.

📖
termes

Embedding de Token

Représentation vectorielle dense et continue de chaque token d'entrée, point de départ de l'architecture transformer avant l'ajout d'informations positionnelles.

🔍

Aucun résultat trouvé