Vaya, Zhipu ha hecho que usar la boca para hacer cosas sea algo habitual hoy en día, y acaba de lanzar un producto de la serie ASR: GLM-ASR, la versión Nano es gratuita y de código abierto/se puede usar localmente. GLM-ASR-2512, almacenado en la nube, tiene una tasa de error de caracteres de 0,0717 y admite caracteres chinos. Se aceptan inglés, dialectos y entornos ruidosos. GLM-ASR-Nano-2512, 1.5B, para operación de baja latencia en dispositivos como computadoras portátiles y teléfonos móviles. También está el [Método de Entrada de IA Zhipu], una herramienta de escritorio que integra a fondo el reconocimiento de voz con modelos a gran escala. Permite dar órdenes simplemente hablando e incluye un modo de susurro que reconoce incluso el habla entrecortada. Pesos y código de inferencia de código abierto GLM-ASR-Nano-2512 GLM-ASR-2512 proporciona API El método de entrada le otorga 2000 puntos gratis. #ASR #GLMASR
GLM-ASR-Nano-2512 Alhuggingface.co/zai-org/GLM-AS…t.co/Smodelscope.cn/models/ZhipuAI…da: https://t.co/uBD2docs.bigmodel.cn/cn/guide/model…Guía del usuario: autoglm.zhipuai.cn/autotyper/ Método de entrada de IA para Mac/Win. Descarga: https://t.co/nQ0YwvufIM
