中国的“登月计划”人工智能项目刚刚发布了首个线性注意力模型。 仅需 30 亿个有效参数,在 100 万 token 的上下文中,其解码速度比全注意力模型快 6 倍,内存占用减少 75% 🤯 100% 开源。
更多此类人工智能工具和项目,请访问 https://t.co/BvTctheunwindai.com Agent、RAG、LLM 和 MCP 教程,并附带开源代码。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年10月31日 16:00
中国的“登月计划”人工智能项目刚刚发布了首个线性注意力模型。 仅需 30 亿个有效参数,在 100 万 token 的上下文中,其解码速度比全注意力模型快 6 倍,内存占用减少 75% 🤯 100% 开源。
更多此类人工智能工具和项目,请访问 https://t.co/BvTctheunwindai.com Agent、RAG、LLM 和 MCP 教程,并附带开源代码。