X (Twitter)

Carregando detalhes do thread

Buscando os tweets originais no X para montar uma leitura limpa.

Isso normalmente leva apenas alguns segundos.

凡人小北 (@frxiaobei): LMArena 的机制很简单:用户面对两段匿名模型输出,只凭观感、流畅度、完成度做出选择。 某种程度上比常规 benchmark 更贴近真… | Thread Easy