正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月18日 10:24
我敢打赌,这要么与线性注意力有关,要么可能是一种推测性的解码方式。
就我经验而言,与这两件事相关的推理错误可能会变得非常棘手。