@pollenrobotics 这是 ReachyGotchi 的早期版本。它支持端到端的语音合成(STT)-> 语言学习(LLM)-> 文本转语音(TTS),并兼容 mlx-audio(感谢 @Prince_Canuma)和 lm-studio。网页配置界面包含视频预览、机器人运动控制、聊天记录录制、记忆启动和音频校准功能,并且支持 tailscale 缩放。希望它能为人工智能提供一些上下文预处理功能。
huggingface.co/spaces/tierral…
我们需要把一些东西迁移到 Rust 或 Zig 上,因为 Robot Pi4 已经开始显得力不从心了。用于流式音频/视频和人脸检测等等。接下来要探索 BlazeFace。
