@allen_ai에서는 학습-추론 불일치를 심층적으로 연구하고 @vllm_project, @thinkymachines, @sgl_project의 비트 단위 일관성 강화 학습(bitwise consistent RL) 연구를 기반으로 발전시킬 계획입니다. 관심 있으신 분은 인턴십(스레드 링크)에 지원하시고 저를 멘션해 주세요.
@allen_ai @vllm_project @thinkymachines @sgl_project 비트 단위 일관성 RL: https://tblog.vllm.ai/2025/11/10/bit…: https://t.co/YiWhZtqEG1