OpenAIがオープンソースのセキュリティ推論モデル「gpt-oss-safeguard」をリリース コンテンツのレビューに特化 モデルバージョン: gpt-oss-セーフガード-120B gpt-oss-セーフガード-20B 従来の「ブラックボックス」コンテンツ モデレーション アルゴリズムとは異なり、 gpt-oss-safeguard はメモリの代わりに推論を使用し、セキュリティ ポリシーを直接読み取り、推論中にそれらのポリシーに従ってコンテンツ レビューを実行します。 学習は必要ありません... これは、コンテンツ セキュリティが「受動的にルールを学習する」段階を超えていることを意味します。 「ルールを積極的に理解する」という新たな段階へ 平均: - ポリシーを再トレーニングする必要はなく、入力テキストのみを変更する必要があります。 - モデルは独自の推論プロセスを出力し、判断を下した理由を説明します。 - 製品やシナリオに合わせて、異なるポリシーをカスタマイズできます。(新機能) - さまざまな製品やさまざまなシナリオに合わせて、さまざまなポリシーをカスタマイズできます。
パフォーマンス評価では、複数のポリシーを同時に実装する場合の精度に関して、gpt-oss-safeguard が GPT-5-thinking や他の gptxiaohu.ai/c/xiaohu-ai/op…います。 詳細:
