X (Twitter)

2021년부터 2025년까지 Code-LLM과 관련 생태계의 발전에 대한 개요입니다.

AI 기반 코드 생성 분야의 프로그래밍 개발 및 연구의 발전.

HumanEval의 코드 언어 모델 진행 상황 타임라인.

SWE-bench-Verified의 코드 언어 모델 진행 상황 타임라인입니다.

2018년부터 2025년까지 폐쇄형 대규모 언어 모델의 발전.

아키텍처별로 그룹화된 오픈 소스 코드 모델의 엄선된 선택입니다.

Kimi-K2-Instruct와 Qwen3-Coder의 아키텍처 비교.

대규모 언어 모델에서 NTP(Next Token Prediction)와 MTP(Multiple Token Prediction)의 훈련 목표를 비교합니다.

모델 학습 단계 개요.

코딩 작업과 벤치마크의 분류.

코드 평가를 위한 요약 지표.

합성 코드 데이터를 정렬하는 세 가지 일반적인 방법.

정렬을 위한 최신 강화 학습 알고리즘에 대한 개요입니다.

강화 학습 방법은 코딩 작업을 분류하는 데 사용됩니다.

코드 LLM 보안 정렬 데이터 생성 프로세스입니다.

논문 링크 – "코드 기반 모델에서 에이전트 및 애플리케이션까지: 코드 인텔리전스에 대한 실용 가이드" https://t.co/MACzydrCIQ

Yangyi(@Yangyixxxx)의 스레드