微信AI,腾讯公司 我认为 CALM 是 DeepSeekOCR/Glyph 的改进版。它不需要“视觉标记”,其工作原理是将图像编码成潜在向量。但他们的功能远不止于添加一个自编码器。 “我们的工作重点是创建一个稳健且平滑的潜在流形。”
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月5日 16:49
微信AI,腾讯公司 我认为 CALM 是 DeepSeekOCR/Glyph 的改进版。它不需要“视觉标记”,其工作原理是将图像编码成潜在向量。但他们的功能远不止于添加一个自编码器。 “我们的工作重点是创建一个稳健且平滑的潜在流形。”