Trudny
Problem Zgodności (Alignment Problem)
Teoretyczne wyzwania związane z dostosowaniem celów AI do ludzkich wartości.
📝 Prompt-Inhalt
Zdefiniuj Problem Zgodności w kontekście sztucznej superinteligencji (ASI). Omów teoretyczne trudności w określaniu funkcji nagrody w taki sposób, aby uniknąć nieintended consequences (niezamierzonych konsekwencji), takich jak trening z gradientem oszustwa (reward hacking). Jak matematycznie ująć ludzkie wartości w funkcji celu?