WeirdML容易受到異常值的影響,但總體而言,我認為它是一個有用的指標。 K2-Thinking能走多遠很有意思。它會超越V3系列的最佳水準嗎?還是能與當前一代的Claude相媲美?
我預測為0.42
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月7日 下午3:12
WeirdML容易受到異常值的影響,但總體而言,我認為它是一個有用的指標。 K2-Thinking能走多遠很有意思。它會超越V3系列的最佳水準嗎?還是能與當前一代的Claude相媲美?
我預測為0.42