我觉得这些批评现在都无关紧要了。这是个表征问题:无论你如何用文字“思考”你对图像标记化整体的理解,你都无法精确地追踪实体。但这并不难解决,大概有四种不同的方法。只是优先级不高。
实际上,如果@vikhyatk愿意的话,他完全可以用边界框和缩放/裁剪来解决这个问题。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月18日 19:07
我觉得这些批评现在都无关紧要了。这是个表征问题:无论你如何用文字“思考”你对图像标记化整体的理解,你都无法精确地追踪实体。但这并不难解决,大概有四种不同的方法。只是优先级不高。
实际上,如果@vikhyatk愿意的话,他完全可以用边界框和缩放/裁剪来解决这个问题。