WeirdMLは外れ値に弱いですが、全体的には有用な指標だと感じています。K2-Thinkingがどこまで進化するのか興味深いところです。V3シリーズの最高傑作を超えるのでしょうか?それとも現世代のClaudesに匹敵するのでしょうか?
私は0.42を予想します
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/07 15:12
WeirdMLは外れ値に弱いですが、全体的には有用な指標だと感じています。K2-Thinkingがどこまで進化するのか興味深いところです。V3シリーズの最高傑作を超えるのでしょうか?それとも現世代のClaudesに匹敵するのでしょうか?
私は0.42を予想します