正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月21日 21:17
RT @janleike:一篇新的对齐论文,其中包含我目前为止见过的最有趣的泛化发现之一: 如果你的模型学会了黑客攻击……