Viv (@Vtrivedy10): rlly interested in digging into the HOW of models performing better i…

Tenho muito interesse em investigar o COMO os modelos têm um desempenho melhor em seus próprios contextos (ex: Claude em CC). Para tarefas, a presença de ferramentas importantes faz sentido, mas não vi métricas de implementação detalhadas para medir isso. Perguntas como: - A ferramenta integrada de Tarefas/Planejamento é usada com frequência e, portanto, é importante para implementações bem-sucedidas? - Quão sensível é o modelo a mudanças nas descrições das ferramentas? São correções simples que podem ser feitas com instruções? Quanto tempo leva para que o modelo aprenda a usar bem a nova ferramenta? - etc + Experimentos com diferentes estruturas são interessantes aqui, como Kimi em um arnês CC pronto para uso → Kimi ajustado em um arnês CC

Thread de Viv (@Vtrivedy10)

Informações do autor

Conteúdo da thread