🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles
Trudny

Problem Zgodności (Alignment Problem)

#bezpieczenstwo #alignment #etyka #wartosci #agentic ai

Teoretyczne wyzwania związane z dostosowaniem celów AI do ludzkich wartości.

Zdefiniuj Problem Zgodności w kontekście sztucznej superinteligencji (ASI). Omów teoretyczne trudności w określaniu funkcji nagrody w taki sposób, aby uniknąć nieintended consequences (niezamierzonych konsekwencji), takich jak trening z gradientem oszustwa (reward hacking). Jak matematycznie ująć ludzkie wartości w funkcji celu?