Angel (@ziran_pu): @pollenrobotics very early version of ReachyGotchi. end to end stt ->…

@pollenrobotics ReachyGotchi의 아주 초기 버전입니다. mlx-audio(감사합니다 @Prince_Canuma)와 lm-studio를 사용하여 stt -> llm -> tts까지 전체 과정을 처리합니다. 웹 설정 UI에는 비디오 미리보기, 로봇 움직임, 채팅 녹화, 메모리 시작 및 오디오 보정 기능이 있으며, 꼬리 크기 조절도 가능합니다. AI를 위한 컨텍스트 프라이밍 기능도 추가될 예정입니다.

huggingface.co/spaces/tierral…

로봇 라즈베리 파이 4에서 오디오/비디오 스트리밍 및 얼굴 인식 등을 위해 Rust나 Zig로 옮겨야 할 것 같습니다. 이제 슬슬 그런 느낌이 드네요. 다음에는 Blazeface를 살펴볼 예정입니다.

Angel(@ziran_pu)의 스레드

작성자 정보

스레드 내용