OpenAI 發布開源安全推理模型:gpt-oss-safeguard 專門用來進行內容審查 模型版本: gpt-oss-safeguard-120B gpt-oss-safeguard-20B 不同於傳統「黑盒」內容審核演算法: gpt-oss-safeguard 以推理代替記憶,能直接讀取你的安全政策,並在推理時遵循該政策執行判斷進行內容審查。 無需學習... 這代表著內容安全從“被動學習規則” 進入「主動理解規則」的新階段 意味著: - 保單不需要再重新訓練,只需修改輸入文字即可。 - 模型能輸出自己的推理過程,說明為何要做出判斷。 - 不同產品、不同場景可以自訂不同政策。新。 - 不同產品、不同場景可以自訂不同政策。
效能評估顯示:gpt-oss-safeguard 在同時執行多個政策下,準確率優於GPT-5-thinking 與其他gpt-oss 模型。 詳細內容:
