X (Twitter)

OpenAI 發布開源安全推理模型：gpt-oss-safeguard 專門用來進行內容審查模型版本： gpt-oss-safeguard-120B gpt-oss-safeguard-20B 不同於傳統「黑盒」內容審核演算法： gpt-oss-safeguard 以推理代替記憶，能直接讀取你的安全政策，並在推理時遵循該政策執行判斷進行內容審查。無需學習... 這代表著內容安全從“被動學習規則” 進入「主動理解規則」的新階段意味著： - 保單不需要再重新訓練，只需修改輸入文字即可。 - 模型能輸出自己的推理過程，說明為何要做出判斷。 - 不同產品、不同場景可以自訂不同政策。新。 - 不同產品、不同場景可以自訂不同政策。

效能評估顯示：gpt-oss-safeguard 在同時執行多個政策下，準確率優於GPT-5-thinking 與其他gpt-oss 模型。詳細內容：

來自小互（@imxiaohu）的推文串

作者資訊

推文串內容