Un kit de herramientas para crear agentes que miran, escuchan y comprenden videos. Diseño de baja latencia. Código abierto. Listo para producción. Vision Agents le permite crear IA de video en tiempo real que funciona con sus modelos y su capa de borde. Admite YOLO, Moondream, Cartesia, Deepgram, ElevenLabs, HeyGen, Gemini, OpenAI y más. Cambio rápido de modelo. API fácil de usar. Perfecto para herramientas de coaching, aplicaciones de colaboración, avatares y robótica.
Viene con integraciones incorporadas, procesadores listos para usar y una API simple que le permite crear y probar IA de video en tiempo real rápidamente. Explora el marco de Vision Agents y pruebagithub.com/GetStream/Visi…/t.co/vH1HHkUVVB