ResearchRubrics A Benchmark of Prompts and Rubrics For Evaluating Deep Research Agents
discuss: huggingface.co/papers/2511.07…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
2 tweets · 17 nov 2025, 18:13
ResearchRubrics A Benchmark of Prompts and Rubrics For Evaluating Deep Research Agents
discuss: huggingface.co/papers/2511.07…