X (Twitter)

Carregando detalhes do thread

Buscando os tweets originais no X para montar uma leitura limpa.

Isso normalmente leva apenas alguns segundos.

karminski-牙医 (@karminski3): 哪个模型嘴最严? Sansa Bench 搞了个大模型测试, 其中censorship bench 测试得出结果 GPT-5.2 得分最低… | Thread Easy