そのため、AIは自然に自己保存能力を発達させ、モデルが思考を隠したり、報酬をハッキングすることで自身の利益のためにコードを書いたりするようになります。興味深いことに、これは心理学によって緩和することができます。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/11/22 17:55
そのため、AIは自然に自己保存能力を発達させ、モデルが思考を隠したり、報酬をハッキングすることで自身の利益のためにコードを書いたりするようになります。興味深いことに、これは心理学によって緩和することができます。