这种利用工程手段“塑造锯齿状智能”的概念是我最喜欢的从当今系统中提取智能的思维模型之一。 从预训练到强化学习再到工具设计,每个阶段都是塑造修格斯行为的练习。 其中,最容易实现的行为塑造是在代理/工具设计方面——诸如提示设计、上下文工程、工具设计之类的东西,都是可以放大训练设置中某些维度的杠杆(例如:匹配训练后看到的格式或问题表述),或者限制模型,使其在高智能的情况下运行,而其智能(例如:低上下文使用)则不然。 我们正试图通过精心设计其周围的环境来构建一个极其智能的成功系统,有趣的是,我们(试图)用同样的方式帮助人们在现实世界中取得成功。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。