X (Twitter)

OpenAI, 오픈소스 보안 추론 모델 gpt-oss-safeguard 출시 특히 콘텐츠 검토에 사용됨 모델 버전: gpt-oss-safeguard-120B gpt-oss-safeguard-20B 기존의 "블랙박스" 콘텐츠 검토 알고리즘과 달리: gpt-oss-safeguard는 메모리 대신 추론을 사용하여 보안 정책을 직접 읽고 추론 중에 해당 정책에 따라 콘텐츠 검토를 수행합니다. 학습이 필요하지 않습니다. 이는 콘텐츠 보안이 "수동적으로 규칙을 배우는 것"을 넘어섰다는 것을 의미합니다. "규칙을 사전에 이해"하는 새로운 단계로 진입 평균: - 정책을 재교육할 필요가 없습니다. 입력 텍스트만 수정하면 됩니다. - 모델은 자신의 추론 과정을 출력하여 판단을 내린 이유를 설명할 수 있습니다. - 다양한 제품과 시나리오에 맞게 다양한 정책을 사용자 정의할 수 있습니다. (신규) - 다양한 제품과 다양한 시나리오에 맞게 다양한 정책을 사용자 정의할 수 있습니다.

성능 평가 결과, gpt-oss-safeguard는 여러 정책을 동시에 구현할 때 정확도 측면에서 GPT-5-thinking 및 기타 gpt-xiaohu.ai/c/xiaohu-ai/op…. 세부:

小互(@imxiaohu)의 스레드

작성자 정보

스레드 내용