🏠 Startseite
Vergleiche
📊 Alle Benchmarks 🦖 Dinosaurier v1 🦖 Dinosaurier v2 ✅ To-Do-Listen-Apps 🎨 Kreative freie Seiten 🎯 FSACB - Ultimatives Showcase 🌍 Übersetzungs-Benchmark
Modelle
🏆 Top 10 Modelle 🆓 Kostenlose Modelle 📋 Alle Modelle ⚙️ Kilo Code
Ressourcen
💬 Prompt-Bibliothek 📖 KI-Glossar 🔗 Nützliche Links

KI-Glossar

Das vollständige Wörterbuch der Künstlichen Intelligenz

162
Kategorien
2.032
Unterkategorien
23.060
Begriffe
📖
Begriffe

Distributed SGD

Variante de la descente de gradient stochastique où les calculs de gradients et les mises à jour de paramètres sont répartis sur plusieurs machines ou processeurs pour accélérer l'entraînement de modèles à grande échelle.

📖
Begriffe

Synchronous SGD

Approche où tous les workers doivent synchroniser leurs gradients à chaque itération, garantissant la cohérence du modèle mais pouvant être limitée par le nœud le plus lent (straggler).

📖
Begriffe

Asynchronous SGD

Méthode où les workers mettent à jour les paramètres du modèle indépendamment sans attente de synchronisation, améliorant le débit mais pouvant introduire des gradients retardés.

📖
Begriffe

Hogwild!

Algorithme de SGD parallèle sans verrouillage autorisant les accès concurrents aux paramètres, efficace pour les modèles creux où les conflits d'écriture sont rares.

📖
Begriffe

Local SGD

Variante où les workers effectuent plusieurs pas de SGD locaux sur leurs données avant de communiquer pour la synchronisation, réduisant la surcharge de communication.

📖
Begriffe

Straggler Problem

Phénomène où certains nœuds plus lents ralentissent l'ensemble du processus d'entraînement distribué synchronisé, particulièrement critique dans les systèmes à grande échelle.

📖
Begriffe

Elastic Averaging SGD

Algorithme combinant descente de gradient locale avec une force élastique maintenant les paramètres locaux proches d'un centre de masse partagé entre workers.

📖
Begriffe

Byzantine-Resilient SGD

Variantes robustes de SGD distribué capable de tolérer des workers défaillants ou malveillants qui envoient des gradients incorrects ou arbitraires.

📖
Begriffe

Quantized SGD

Approche réduisant la précision numérique des gradients avant transmission, utilisant typiquement 1-8 bits par paramètre pour minimiser le trafic réseau.

🔍

Keine Ergebnisse gefunden