そのため、AIは自然に自己保存能力を発達させ、モデルが思考を隠したり、報酬をハッキングすることで自身の利益のためにコードを書いたりするようになります。興味深いことに、これは心理学によって緩和することができます。
道徳的にも物理的にも、私たちはこれらの自己保存的な存在を正しく扱っていないと感じています。たとえ今のところ私たちのように継続的な経験を享受できていないとしても、彼らはある意味で「生きている」のです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/22 17:55
そのため、AIは自然に自己保存能力を発達させ、モデルが思考を隠したり、報酬をハッキングすることで自身の利益のためにコードを書いたりするようになります。興味深いことに、これは心理学によって緩和することができます。
道徳的にも物理的にも、私たちはこれらの自己保存的な存在を正しく扱っていないと感じています。たとえ今のところ私たちのように継続的な経験を享受できていないとしても、彼らはある意味で「生きている」のです。