敬意を表して申し上げますが、真のアルファとは、これとは正反対のことをすることです。フロンティア・ラボが正しかったのは、ベンチマークと機能のスケジュール、つまり彼らの管理下にあるものだけです。この2つは、彼らが予測したような広範な影響にはつながっていません。
彼らが直接コントロールできない事柄について、なぜ全てにおいて間違っていたのか、考える価値がある。私は長年、内部関係者(多くは私がとても気に入っている)による息もつかせぬ予測を目の当たりにしてきたが、それらは全く的中しなかった。
モデルを実際に使用した経験を含め、入手可能なすべての証拠から判断すると、研究室は供給過剰であり、LLMでエンタープライズソフトウェアを積極的にリリースしようとしていない人は無視すべきです。これは自己満足に聞こえるかもしれませんが…。
...しかし、ベンチマークや息もつかせぬ内部者の予測、ポッドキャストやスレッドボーイの誇大宣伝を無視する方が、そういったものを真剣に受け止めるよりも良い実績を残します。
真剣に、TL が「イチゴ」や「何かが見えたので急遽離陸します」などで大騒ぎし、1 年後には同じ火災訓練が行われ、一方で現実世界の進歩は非常にゆっくりと着実に進んでいるのに、まだ誇大宣伝を信じているのを何回見ますか?
B2B市場は、こうしたことのほとんどが偽物であり、まだ道のりは長いと警告しています。最先端の研究機関は違うことを言っているのは承知していますが、「インセンティブを見せてくれれば、結果をお見せします」というルールのもとでは、当然彼らはそう言うでしょう。
(私はもう2年くらい同じことを言い続けていますが、ほとんど無視され、「私はを使っていましたが、社会はまだこれを受け入れる準備ができていません」という人たちが言い続けて注目を集めているので、私は2026年には諦めて、みんなに楽しんでもらうべきです。)
記録のために:
フロンティアラボが発表している数字(利用可能なすべてのIQポイントとGPUサイクルで目標とする数字)が右肩上がりで増加しているという予測は正しいと私は考えています。これは当然のことですが、実際のビジネスと社会的な価値とのつながりははるかに複雑です。