와, 지푸는 이제 입을 사용해서 뭔가를 하는 걸 표준으로 만들었고, 최근에는 ASR 시리즈 제품인 GLM-ASR을 출시했네요. 나노 버전은 무료 오픈 소스라서 로컬에서 사용할 수 있어요. 클라우드에 저장된 GLM-ASR-2512는 문자 오류율이 0.0717이며 중국어 문자를 지원합니다. 영어, 방언, 시끄러운 환경 모두 허용됩니다. GLM-ASR-Nano-2512, 1.5B는 노트북 및 휴대폰과 같은 장치에서 낮은 지연 시간으로 작동하도록 설계되었습니다. 또한 음성 인식을 대규모 모델과 심층적으로 통합한 데스크톱 도구인 [Zhipu AI 입력 방식]도 있습니다. 이 도구를 사용하면 말만으로 간단하게 명령을 내릴 수 있으며, 숨소리까지 인식하는 속삭임 모드도 포함되어 있습니다. GLM-ASR-Nano-2512 오픈소스 가중치 및 추론 코드 GLM-ASR-2512는 API를 제공합니다. 이 입력 방식을 사용하면 2000점을 무료로 받을 수 있습니다. #ASR #GLMASR
GLM-ASR-나노-2512 HF: huggingface.co/zai-org/GLM-AS… Modamodelscope.cn/models/ZhipuAI…2TmcINh GLM-ASR-251docs.bigmodel.cn/cn/guide/model…co/Tq9yHmJQrQ AI autoglm.zhipuai.cn/autotyper/ps://t.co/nQ0YwvufIM
