如果“认知核心”只知道最少的事实,那么上下文中必须包含大量信息,使用预先计算好的想法的卡带比每次查询都扫描原始文档要高效得多。
此外,之前的“前缀调谐”论文证明,KV 前缀也可以起到微调的作用,因此卡带也可以包含技能、文本样式等。而且与 LoRA 适配器不同,它们是可组合的。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年10月30日 17:37
如果“认知核心”只知道最少的事实,那么上下文中必须包含大量信息,使用预先计算好的想法的卡带比每次查询都扫描原始文档要高效得多。
此外,之前的“前缀调谐”论文证明,KV 前缀也可以起到微调的作用,因此卡带也可以包含技能、文本样式等。而且与 LoRA 适配器不同,它们是可组合的。