@pollenrobotics 這是 ReachyGotchi 的早期版本。它支援端對端的語音合成(STT)-> 語言學習(LLM)-> 文字轉語音(TTS),並相容於 mlx-audio(感謝 @Prince_Canuma)和 lm-studio。網頁配置介麵包含視訊預覽、機器人運動控制、聊天記錄錄製、記憶啟動和音訊校準功能,並支援 tailscale 縮放。希望它能為人工智慧提供一些上下文預處理功能。
huggingface.co/spaces/tierral…
我們需要把一些東西移到 Rust 或 Zig 上,因為 Robot Pi4 已經開始顯得力不從心了。用於串流音訊/視訊和人臉偵測等等。接下來要探索 BlazeFace。
