なんと、Zhipu は口を使って物事を行うことを今日では標準にし、ASR シリーズ製品である GLM-ASR をリリースしました。Nano バージョンは無料でオープン ソースであり、ローカルで使用できます。 クラウドに保存されている GLM-ASR-2512 は、文字エラー率が 0.0717 で、中国語の文字をサポートしています。 英語、方言、騒がしい環境でも大丈夫です。 GLM-ASR-Nano-2512、1.5B、ノートパソコンや携帯電話などのデバイスでの低遅延操作用。 また、音声認識と大規模モデルを高度に統合したデスクトップツール「Zhipu AI Input Method」もご用意しています。話しかけるだけでコマンド入力が可能で、息の混じった音声も認識できるウィスパーモードも搭載しています。 GLM-ASR-Nano-2512 オープンソースの重みと推論コード GLM-ASR-2512はAPIを提供する 入力方法では 2000 ポイントが無料で付与されます。 #ASR #GLMASR
GLM-ASR-ナノ-2512 HF: huggingface.co/zai-org/GLM-AS… Modamodelscope.cn/models/ZhipuAI…D2TmcINh GLM-ASR-25docs.bigmodel.cn/cn/guide/model…co/Tq9yHmJQrQ AI autoglm.zhipuai.cn/autotyper/https://t.co/nQ0YwvufIM
