真是太棒了。既然我们现在有了快速的长上下文和充足的计算资源,是时候再次探索字节级模型了。Meta 的 MegaByte 模型让我失望了,但 Meta 的执行效率本来就很差。这条路还没走完……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月16日 01:12
真是太棒了。既然我们现在有了快速的长上下文和充足的计算资源,是时候再次探索字节级模型了。Meta 的 MegaByte 模型让我失望了,但 Meta 的执行效率本来就很差。这条路还没走完……