Sei que o Llama deu o pontapé inicial na corrida do aprendizado de máquina de código aberto, mas para mim a família SAM é a coisa mais legal de aprendizado de máquina em todos os lançamentos de aprendizado de máquina do Facebook/Meta ao longo dos anos (definitivamente um carinho especial por pesquisa em visão computacional). Ainda estamos nos estágios iniciais de utilização de agentes em conjunto com modelos de visão computacional como ferramentas. A percepção ainda é um problema com os modelos de percepção visual, mas talvez consigamos contornar isso temporariamente com ferramentas personalizadas. O SAM agora possui modelos em imagens, vídeos e reconstruções 3D, o que abre muitas possibilidades interessantes.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.