Uau, a Zhipu tornou o uso da boca um padrão hoje em dia e acaba de lançar um produto da série ASR: o GLM-ASR. A versão Nano é gratuita e de código aberto, podendo ser usada localmente. O GLM-ASR-2512, armazenado na nuvem, tem uma taxa de erro de caracteres de 0,0717 e suporta caracteres chineses. Inglês, dialetos e ambientes ruidosos são todos aceitáveis. GLM-ASR-Nano-2512, 1.5B, para operação de baixa latência em dispositivos como laptops e celulares. Existe também o [Método de Entrada de IA Zhipu], uma ferramenta para computador que integra profundamente o reconhecimento de voz com modelos de grande escala. Ele permite que você dê comandos simplesmente falando e inclui um modo de sussurro que consegue reconhecer até mesmo a fala sussurrada. Código de inferência e pesos de código aberto GLM-ASR-Nano-2512 GLM-ASR-2512 fornece API O método de entrada concede 2000 pontos grátis. #ASR #GLMASR
GLM-ASR-Nano-2512 HFhuggingface.co/zai-org/GLM-AS…AW Comodelscope.cn/models/ZhipuAI…t.co/uBD2TmcINh GLMdocs.bigmodel.cn/cn/guide/model…rio: https://t.co/autoglm.zhipuai.cn/autotyper/o método de entrada de IA para Mac/Win: https://t.co/nQ0YwvufIM
