誰もが ___ の状況レポートからお気に入りのスライドを持っていると思いますが、これは私のものです! 可観測性 —> 評価 —> 改善 基本的に: 1. 可観測性:エージェントをより良くしたいので、実際に何をしているのかを把握する必要があります。すべてをログに記録するのは良いデフォルト設定です。役に立たない場合は後で削除しますが、少なくとも検査は可能です。 2. 評価: 重要なタスクがあり、それらに対してエージェントをテストし、フィードバックが増えたら拡張する必要があります。 3. 改善: 大量のデータを処理して、何が起こっているかをパターンマッチングできる魔法のマシンがあります。これらのマシンをデータに使用して、プロンプト、スキル、サブエージェントを改善する方法を見つけ出す必要があります。 私の使命(すでに持っているものを受け入れるかどうか):29.4%を0にする 私は以前(そして今でもある程度)コーディングやエージェントの改善に「雰囲気重視」を心がけていました。ただ使ってみて、雰囲気を感じて、いろいろ試してみる、といった感じです。 しかし、エージェントの痕跡をエージェントで分析してエージェントを改善するというパターンも良いです…実際素晴らしいです 「データを見てください」 - @HamelHusain 「データを確認するために保存することを忘れないでください」 - 私 このレポートの残りの部分には、人々が実際にエージェントを何に使っているかなど、興味深い情報がたくさんある。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。