キミは好きだけど、そこまで賢くないのは確かだし、クロード4.5ソネットよりは全然賢くない。人工分析指数(や他のベンチマーク)は少し誤解を招くかもしれないけど、みんなもう知ってただろうね。キミはしょっちゅう単純なミスや読解ミスをする。
4ビット量子化のせいだと思います。それ以外は、Kimiはよく訓練されたモデルのように見えます。エラーをほのめかす程度なら大抵は検出できますが、もっと深刻な問題は、Kimiが勝手に何かを分析しようとして、ただダメになってしまうことです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/23 17:21
キミは好きだけど、そこまで賢くないのは確かだし、クロード4.5ソネットよりは全然賢くない。人工分析指数(や他のベンチマーク)は少し誤解を招くかもしれないけど、みんなもう知ってただろうね。キミはしょっちゅう単純なミスや読解ミスをする。
4ビット量子化のせいだと思います。それ以外は、Kimiはよく訓練されたモデルのように見えます。エラーをほのめかす程度なら大抵は検出できますが、もっと深刻な問題は、Kimiが勝手に何かを分析しようとして、ただダメになってしまうことです。