Llama がオープンソースの LLM レースを先導したのは知っていますが、私にとって SAM ファミリーは、FB/Meta の長年にわたる ML リリースすべての中で最もクールな ML です (CV 研究からの弱点であることは間違いありません)。 エージェントをCVモデルと組み合わせてツールとして使うのはまだ初期段階です。VLMでは認識がまだ課題ですが、しばらくはカスタムツールでその問題を解決できるかもしれません。 SAMには現在、画像、ビデオ、3D再構成のモデルがあり、多くの素晴らしい可能性を秘めています。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。