一套用於建立能夠觀看、聆聽和理解影片的智慧體的工具包。 低延遲設計。開源。可直接用於生產環境。 Vision Agents 可讓您建立與您的模型和邊緣層協同工作的即時視訊 AI。 支援 YOLO、Moondream、Cartesia、Deepgram、ElevenLabs、HeyGen、Gemini、OpenAI 等。 快速模型切換。易於使用的API。 非常適合用於教練工具、協作應用程式、虛擬形象和機器人技術。
它內建整合功能、即用型處理器和簡單的 API,可讓您快速建立和測試即時視訊 AI。 探索視覺代理框架並嘗試以下範例: https://t.co/vH1HHkUVVB