@posthog チームが共有した、実稼働レベルの AI エージェントを開発した 1 年間の実践経験 アーキテクチャ哲学、戦術的実装、開発の落とし穴、製品エクスペリエンスという 4 つの側面から見てみましょう。 I. コアアーキテクチャ哲学:シンプルさは複雑さよりも優れています。複雑な構成は、多くの場合、役に立たないだけでなく、有害でもあります。 1. エージェントはワークフローよりも優れている。誤解:初期のAI業界では、グラフや定義済みのワークフローを用いてAIを制御することが普及し、AIの制御性が向上すると考えられていました。 • 現実:このアプローチは、オープンエンドのタスクを扱う際に非常に脆弱です。AIが設定されたパスから逸脱すると、自己修正ができなくなるだけでなく、コンテキストも失ってしまいます。 結論:現在のアーキテクチャは単純な単一ループに戻ります。LLMは、タスクが完了するまで、このループ内で継続的に実行、検証、および自己修正を行います。 2. 単一エンティティループはサブエージェントよりも優れている。誤解:多くの人が複雑な「サブエージェント」アーキテクチャを設計したがります。 現実:抽象化と特殊化の層が増えるごとに、コンテキストの大幅な損失につながります。モデルが最適な意思決定を行うには、完全なグローバル情報が必要です。 結論: シンプルなツールセットを備えた単一の LLM ループは、それぞれ独自の役割を持つサブエージェントのグループよりもスマートかつ効率的に動作することがよくあります。 II. 主要な戦術的実装: モデルの「焦点」と「理解」を可能にする 非常に実用的な 2 つの「マイクロマネジメント」テクニック: 1. ToDoリストは超強力です。エージェントが長いタスクに「迷子」になるのを防ぐため、一見冗長に見えるtodo_writeというツールが導入されました。 これは実際には強化された「マインドチェーン」です。エージェントは各ステップの後にこのリストを更新し、次の目標を継続的に強化するように強制することで、タスク完了率を大幅に向上させます。 2. 文脈が重要です。ユーザーの質問は曖昧な場合が多くあります(例:スペルミスや社内用語など)。文脈に関する知識がなければ、AIは質問を正しく理解できません。 彼らはクロード・コードのアプローチを借用し、「/init」コマンドを導入しました。Web検索と分析を通じて、エージェントのためのプロジェクトレベルのメモリを構築し、AIがユーザーのビジネスを真に「理解」できるようにしました。 III. 開発の落とし穴:2つの非常に厳しい警告に注意:フレームワークと評価は理論のみ 1. フレームワークへの過度な依存を拒否する。彼らはLangChainとLangGraphを使用したことを後悔していると明言しました。 AIモデルは非常に速いペースで反復されるため、重いフレームワークでは変化に対応できず、かえって負担になってしまうことがよくあります。APIを直接呼び出すことが、多くの場合最も柔軟で持続可能なアプローチであるため、コードを「低レベル」に保つことを推奨しています。 2. 評価は万能薬ではありません。テストセットは重要ですが、現実世界の複雑さ(ダーティデータ、奇妙なユーザーパスなど)はテストセットの範囲をはるかに超えています。 彼らは「Traces Hour」(実際のログを人間が定期的にレビューすること)の重要性を強調しました。完璧なテストスイートを実行するよりも、実際のユーザーがAIとどのようにインタラクションするかを理解することの方が価値があります。 IV. 製品体験とモデル戦略 1. プロセス全体を見せましょう。AIを完全なブラックボックスとしてパッケージ化しようとしないでください。ユーザーは「透明性」のあるAIをより信頼します。 PostHog AIは、すべてのツール呼び出し、推論プロセス、さらには失敗した試行までも表示します。この「ホワイトボックス」体験は、ユーザーの信頼を高め、問題の特定を容易にします。 2. モデルの成長を活かす:現在の「バージョン対応」は、コアループにはClaude Sonnet 4.5、推論と複雑なクエリ生成にはOpenAI o4-miniです。しかし、開発者は常に、より強力な次世代モデルへの対応に備える必要があります。 要約 PostHog の過去 1 年間の経験を要約すると、「良いものと悪いものを分ける」ということです。 彼らは、一見洗練されているように見えても実際には煩雑だった初期のAI開発における「マルチエージェント・コラボレーション」、「複雑なグラフ・オーケストレーション」、「重い開発フレームワーク」を放棄し、最もシンプルなシングルループ・アーキテクチャへと回帰しました。モデルに明確な記憶(ToDo)、より豊富なコンテキスト、そしてより透明性の高いインタラクションを与えることで、真に有能なAIアシスタントを作り上げました。 ブログアドレス
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
