Waouh, Zhipu a banalisé l'utilisation de la bouche pour accomplir des tâches et vient de sortir un produit de la série ASR : GLM-ASR. La version Nano est gratuite et open source/peut être utilisée localement. GLM-ASR-2512, stocké dans le cloud, a un taux d'erreur de caractères de 0,0717, prenant en charge les caractères chinois. L'anglais, les dialectes et les environnements bruyants sont tous acceptables. GLM-ASR-Nano-2512, 1,5B, pour un fonctionnement à faible latence sur des appareils tels que les ordinateurs portables et les téléphones mobiles. Il existe également [Zhipu AI Input Method], un outil de bureau qui intègre la reconnaissance vocale à des modèles à grande échelle. Il permet de donner des commandes simplement en parlant et comprend un mode chuchotement capable de reconnaître même une voix soufflée. Code open-source des poids et de l'inférence GLM-ASR-Nano-2512 GLM-ASR-2512 fournit une API Cette méthode de saisie vous offre 2000 points gratuits. #ASR #GLMASR
GLM-ASR-Nano-2512 HFhuggingface.co/zai-org/GLM-AS…jAW Cmodelscope.cn/models/ZhipuAI…//t.co/uBD2TmcINh Gdocs.bigmodel.cn/cn/guide/model…'utilisateur : httautoglm.zhipuai.cn/autotyper/Méthode de saisie IA pour Mac/Windows : https://t.co/nQ0YwvufIM
