X (Twitter)

正在加载线程详情

正在从 X 获取原始推文,整理成清爽的阅读视图。

通常只需几秒钟,请稍候。

karminski-牙医 (@karminski3): 哪个模型嘴最严? Sansa Bench 搞了个大模型测试, 其中censorship bench 测试得出结果 GPT-5.2 得分最低… | Thread Easy