Sé que Llama impulsó la carrera de aprendizaje automático de código abierto, pero para mí la familia SAM es lo mejor en aprendizaje automático de entre todos los lanzamientos de FB/Meta a lo largo de los años (sin duda, un punto débil de la investigación de CV). También estamos en las primeras etapas del uso de agentes junto con modelos de visión por computadora como herramientas. La percepción aún presenta problemas con los modelos de lenguaje visual, pero quizás podamos solucionarlo temporalmente mediante herramientas personalizadas. SAM ahora cuenta con modelos en imágenes, vídeos y reconstrucciones 3D, ¡así que hay muchísimas posibilidades interesantes!
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.