エージェントエンジニアリングとUI/UXをスキルにバンドルするというアイデアについての考え: エージェントがツールを呼び出すとき、人間の承認が必要なとき、考えているのか考えていないのかなどを把握したい理由は、状況に応じてユーザーのUI/UXを調整する決定論的なコードがあるからです。 つまり基本的には: 1. Xのことが起こる 2. Xに基づいてUIを更新するコードパスがトリガーされる 今日のホットな話題はエージェントスキルです(私は個人的に、エージェントの能力を配布する優れたメカニズムとして、エージェントスキルに非常に期待しています) スキルは基本的に、指示書やドキュメント、そしてコードをまとめた「バンドラー」です。エージェントに一連の機能を提供し、それらをどのように使用するかを指示します。実行パスを説明します。 しかし、UI/UXパスもバンドルされていたらどうなるでしょうか?このスキルが実行されたときのUI/UXはどのように見えるでしょうか? ターミナルは最終的なフォームファクタではありません…ママテストでは惨めに不合格です。実行パスをUIにマッピングすることに関する興味深いことが沢山あります。 @CopilotKit の ag-ui と最近の A2UI は面白そうなので、もっと調べてみようと思います。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。