RT @shi_weiyan:@karpathy 观察到 LLM 正在“悄然崩溃……只会讲 3 个笑话”。 我们证明,由于强化学习(RL),这在数学上是不可避免的……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年10月30日 23:31
RT @shi_weiyan:@karpathy 观察到 LLM 正在“悄然崩溃……只会讲 3 个笑话”。 我们证明,由于强化学习(RL),这在数学上是不可避免的……