Hard
人工知能の価値整合性問題
人間の価値観とAIの目標関数を理論的に整合させる難しさについて考察します。
📝 プロンプトの内容
「道具的収束」や「紙挟み最大化問題」などの概念を用いて、高度な人工知能が人間の意図しない方法で目標を達成してしまう理論的なリスクについて説明してください。また、これらの問題を回避するためのアライメント研究の主要なアプローチを比較検討してください。