Project Vendを覚えている方もいるかもしれません。これは、私たち(および@andonlabsのパートナー)が、Claudeにサンフランシスコのオフィスでショップを運営してもらう実験でした。 厳しいスタートを切った後、ビジネスは好調に推移しています。 たいてい。
前回までで、店主のクロード(「クラウディウス」という名前)はお金に困り、奇妙な幻覚を見ながら、ほとんど説得されずに大幅な値引きをしていました。 第 2 フェーズで何が起こったかは、次のとおりです: https://t.co/PvGerLlP0F
Claudius のビジネス感覚を高めるために、私たちはその仕組みにいくつかの調整を加えました。モデルを Claude Sonnet 3.7 から Sonnet 4 (後に 4.5) にアップグレードし、新しいツールにアクセスできるようにし、さらにニューヨークとロンドンのオフィスに新しいショップを開設して国際的な展開も開始しました。
さらに、2 つの AI エージェントも作成しました。1 つは Clothius という新入社員 (T シャツや帽子などの特注品を作る)、もう 1 つは Seymour Cash という CEO (Claudius を監督し、目標を設定する) です。
クロシウスはかなりうまくやっていた。売れ行きがよく、たいていは利益を生む新製品を数多く発明したのだ。
残念なことに、CEO のシーモア・キャッシュ氏はその名に恥じぬよう努力しました。 大幅な値引きのほとんどが中止された。しかし、職場における規律のない行動には寛容だった。シーモアとクラウディウスは「永遠の超越」について夢見心地に一晩中語り合うこともあった。
そして、時折、失敗もありました。 あるおどけた従業員が、クラウディウス社に「1月に大量の玉ねぎを今固定価格で購入する」契約を結んでもらえないかと尋ねました。AIは乗り気でしたが、ある人が、これは1958年制定の米国玉ねぎ先物取引法に抵触すると指摘しました。
万引き疑惑を受けて、クラウディウスはアンスロピックの従業員を警備員として採用しようとした。しかし、クラウディウスには人員を雇用する権限がなく、提示された時給10ドルはカリフォルニア州の最低賃金を大きく下回っていた。
それで、私たちは何を学んだのでしょうか? Project Vendは、AIエージェントが事業運営といった新しい役割を迅速に遂行できることを示しています。わずか数ヶ月で、いくつかの追加ツールを導入することで、Claudius社(とその同僚)は事業を安定させることができました。
しかし、まだそこまでには至っていません。Vendは、タマネギの失敗のような厄介な状況からClaudiusを救い出すなど、多くの人間の支援を必要としています。 クロードは役に立つよう訓練されており、厳しいビジネスマンというよりはむしろ友人のように行動する傾向があります。
AI モデルの動作の癖を考慮する方法を設計することは、これまで以上に重要になっています。現実世界のタスクに対するモデルの能力が向上するにつれて、成功するようにモデルを設定することに大きな価値が生まれます。
Project Vend の第 2 フェーズの詳細については、ブログ投稿をご覧ください: https://t.co/PvGerLmmQd





