O OfficeQA é interessante porque acreditamos que qualquer recém-formado consegue executar as tarefas de forma confiável, mas isso evidencia os desafios que as empresas enfrentam com a IA. Agentes mais experientes, com nossas ferramentas de IA para documentos mais recentes, apresentam um desempenho um pouco melhor, mas ainda há muito espaço para melhorias. Esperamos que os pesquisadores considerem isso útil!
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.