X (Twitter)

夕食中に、友人からAI製品開発で最も難しいステップは何だと思うかと聞かれました。よく考えてみると、フィードバックと評価の仕組みを設計することだと感じました。まず、合計と差を定義する必要があります。つまり、報酬関数を見つける必要があります。しかし、このステップは多くの製品にとって難しい場合があります。多くのシナリオでは、良いものと悪いものを区別するための定量化可能な指標を構築することが難しいためです。フィードバック指標は、一般的に、明示的フィードバックと暗黙的フィードバックの 2 つのカテゴリに分けられます。明示的なフィードバックには、返信、いいね、嫌いなどが含まれます。暗黙的なフィードバックには、正規化されたユーザー行動分析 (クリック、滞在時間など) などが含まれます。しかし、明示的なフィードバックの難しさは、それが肯定的ではなく否定的な制約になるという事実にあります。たとえば、たとえユーザーが「良い」フィードバックをしたとしても、ユーザーにこの製品は素晴らしいと言うように促すことはできません... プラスのメリットはあまりありません。人々が「悪い」フィードバックを与えるとき、彼らはそのフィードバックが改善につながることを期待しています。しかし、良いフィードバックは彼ら個人に利益をもたらすのではなく、システムに安心感と励ましを与えるだけです。ここで問題が浮上します。製品の初期の成功は、フィードバックではなく専門家の経験に左右されるということです。60ポイント程度に達した後になって初めて、明確な肯定的なフィードバックを徐々に集められるようになるのです。ある程度、ほとんどの AI 製品は初期段階では AI 自体ではなく人間の介入に依存しています。しかし、人間でさえ「良い」とは何かを正確に説明できるとは限りません。「良い」を計測し、それを複数の直交要素次元に分解し、それらの次元に基づいて評価・改善していくことは、比較的難しい作業です。これがうまくいけば、AI製品の進歩はよりスムーズになるでしょう。

Yangyi（@Yangyixxxx）のスレッド

作者情報

スレッド内容