正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月12日 04:40
连微博现在都在做推理游戏了。 Qwen2.5-Math-1.5B 微调(如果你想知道的话)。 即使他们本可以引用更多现有技术,但他们基于熵的方法也是合理的。