新年にはSymbolicがビッグニュースを発表します。今後の展開にご注目ください。その際には、ちょっとした勝利のラップを披露し、発表内容を実現したアプローチについていくつかお話ししたいと思います。しかし、CTOとしての私の秘訣は、AIの誇大宣伝を全く信じていないことです🤷♂️
GitHubのスターが山ほどある「AI」リポジトリの宣伝は信じていません。クローンしてみると、実際にはそれほど多くの作業は行われておらず、興味深いものがあれば、依存関係を追加することなく自分のアプリに取り込めることに気づきました。
「研究室で見た秘密の物質のせいで、世界は瞬時に変わる」という誇大宣伝は信じない。あの曖昧な投稿は当時も今も信じない。研究室に何があるか、そして世界についてあなたは間違っている。あなたは蛇の目を丸くした。
フロンティアラボのあの機能リリースが、あの製品カテゴリー全体を席巻したという誇大宣伝は信じません。皆さんのほとんどとは違い、私はデモ動画を一時停止して、出力をじっくりと見て、時間をかけて評価しますが、大抵はひどい出来で、偽物で、誇大宣伝されています。
「AIがニュース記事を書けるようになったらコンテンツは完成する」という誇大宣伝は信じていません。GPT-3の頃からそう言われてきましたが、当時も今も真実ではありません。私はジャーナリストと一緒に仕事をしていて、AIにニュース記事を書かせようとしているので、これは専門的な問題だと知っています。
コーディングモデルに関する誇大宣伝、少なくともその極端なバージョンは信じていません。ソフトウェアエンジニアリングの技術において、何が良いのか、何が悪いのかを深く理解することのリターンは、AIの登場によって低下するどころか、むしろ上昇しています。(とはいえ、ジュニア開発者は本当に困っています。)
ベクターデータベースの誇大宣伝は信じていませんでした。Postgresを使い続けていたし、pgvectorは初期の頃は十分に優れていて、その後もさらに良くなっていきました。しかし、新しい依存関係を追加するハードルは非常に高く、それに「スターがたくさんついている」というのはどうでしょうか。
エージェントに関する誇大広告は信じていません。優秀なエージェントは実にシンプルで、人間に確認するまでほとんど何もしません。エージェントのエラーは相殺されず、むしろ悪化します。ですから、できる限りスムーズに進めるのが最善です。
フロンティア・ラボの予測は信じない。だって、もちろん、将来のベンチマーク性能に関するラボの予測は的中しているんだから。「数値が上がる」ことと、それに伴う金額の違いをご存知ですか? フロンティア・ラボと「インテリジェンス」の乖離は、ますます深まっている。
LLMに関する誇大宣伝は信じていません。これは、シーケンスを引き出すのに役立つ非常に限定的で脆弱な技術であり、ユーザーを経済的に価値のある潜在空間の領域に導くには、膨大なソフトウェアエンジニアリングが必要です(コンテキストエンジニアリングの誇大宣伝は事実ですが)。LLM != AGI
Symbolic では、冷静さを保ち、浮かれすぎないこと、そして、ビジネスを展開するなら絶対にやらなければならないこと、つまり顧客の本当の問題を特定して解決することを静かに実行することで、驚くべき成果を上げてきました。
AI の開発者として、AI の誇大宣伝や漠然とした投稿、過度の FOMO (取り残される可能性)、スレッドボーイを無視し、LLM をツールボックス内の 1 つのツール、および呼び出して有用な応答を取得できるもう 1 つの REST API として扱うことで、非常に大きな進歩がありました。
2026 年の AI に関する私の予測は、実際の作業を行っている実際の顧客向けの実際の機能に LLM を組み込むという厳しい現実からベンチマークの数値がさらに乖離し続けるにつれて、すべての AI チャットの 90% を無視することによるアルファの量は増加する一方だということです。