我知道 Llama 开启了开源机器学习的竞赛,但对我来说,SAM 系列是 Facebook/Meta 多年来所有机器学习版本中最酷的(绝对是计算机视觉研究的功劳)。 目前将智能体与计算机视觉模型结合使用还处于非常早期的阶段。感知问题仍然是虚拟语言模型的一个难题,但我们或许可以通过定制工具暂时解决这个问题。 SAM现在拥有图像、视频和3D重建模型,真是太棒了,有很多很酷的可能性。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。