X (Twitter)

Uma visão geral da evolução dos Code-LLMs e seu ecossistema relacionado de 2021 a 2025.

A evolução do desenvolvimento de programação e da pesquisa em geração de código orientada por IA.

Cronograma do progresso dos modelos de linguagem de código no HumanEval.

Cronograma do progresso dos modelos de linguagem de código no SWE-bench-Verified.

A evolução dos modelos de linguagem de código fechado em larga escala de 2018 a 2025.

Uma seleção criteriosa de modelos de código aberto agrupados por arquitetura.

Comparação de arquitetura entre Kimi-K2-Instruct e Qwen3-Coder.

Comparação dos objetivos de treinamento para Previsão do Próximo Token (NTP) e Previsão de Múltiplos Tokens (MTP) em modelos de linguagem de grande escala.

Uma visão geral da fase de treinamento do modelo.

Classificação de tarefas de codificação e benchmarks.

Métricas resumidas para avaliação de código.

Três métodos típicos para alinhar dados de código sintético.

Uma visão geral dos algoritmos de aprendizado por reforço mais recentes para alinhamento.

Métodos de aprendizado por reforço são usados para classificar tarefas de codificação.

Processo de geração de dados de alinhamento seguro do Code LLM.

Link para o artigo – "De Modelos Fundamentais de Código a Agentes e Aplicações: Um Guia Prático para Intarxiv.org/abs/2511.18538tps://t.co/MACzydrCIQ

Thread de Yangyi (@Yangyixxxx)

Informações do autor

Conteúdo da thread