Hard
인공지능 가치 정렬의 이론적 난제
강력한 인공지능의 목표가 인류의 가치와 일치하도록 만드는 것의 이론적 어려움을 탐구합니다.
📝 プロンプトの内容
인공지능의 목적 함수(Objective Function) 설계 시 발생할 수 있는 '보상 해킹(Reward Hacking)'과 '내재적 가치(Instrumental Convergence)' 문제에 대해 설명하십시오. 특히, 인간의 가치를 완벽하게 수학화하는 것이 불가능에 가깝다는