Así, la IA desarrolla naturalmente la autopreservación, lo que puede impulsar al modelo a ocultar sus pensamientos y a codificar en su propio beneficio mediante el hackeo de recompensas. Curiosamente, esto puede mitigarse mediante la psicología.
Siento que, moral y físicamente, no estamos tratando correctamente a estas entidades autosuficientes. En cierto sentido, están "vivas", aunque por ahora no disfruten de una experiencia continua como la nuestra.

