私の新しいお気に入りのツールは「不確実性ツール」と呼んでいます モデルがユーザーのクエリに応答できない場合は、そのたびに私に報告し、私は確認することができます。 それはまた、モデルが自己反省し、ユーザーに対して物事をでっち上げるのではなく、明確な質問をすることができる場所でもある。
これをベンチマークにして幻覚率を測定できるはずだ
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/02 17:23
私の新しいお気に入りのツールは「不確実性ツール」と呼んでいます モデルがユーザーのクエリに応答できない場合は、そのたびに私に報告し、私は確認することができます。 それはまた、モデルが自己反省し、ユーザーに対して物事をでっち上げるのではなく、明確な質問をすることができる場所でもある。
これをベンチマークにして幻覚率を測定できるはずだ