중국어권에서 LLM 과정을 수강하는 것이 얼마나 다르게 느껴질지 가끔 궁금해집니다. DeepSeek이 R1 이후 겪었던 '진심'의 퇴보가 언어의 장벽 너머에는 존재하지 않는 것일지도 모르겠습니다.
그렇긴 하지만, 효율적인 토크나이저는 여전히 복합 중국어 단어와 심지어 주요 부분 문자열까지 사용합니다 (Qwen의 토크나이저는 전형적인 중국 공산당의 속어 표현을 표현하는 데 50자 정도를 썼던 기억이 납니다).
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 12. 13. 오전 7:39
중국어권에서 LLM 과정을 수강하는 것이 얼마나 다르게 느껴질지 가끔 궁금해집니다. DeepSeek이 R1 이후 겪었던 '진심'의 퇴보가 언어의 장벽 너머에는 존재하지 않는 것일지도 모르겠습니다.
그렇긴 하지만, 효율적인 토크나이저는 여전히 복합 중국어 단어와 심지어 주요 부분 문자열까지 사용합니다 (Qwen의 토크나이저는 전형적인 중국 공산당의 속어 표현을 표현하는 데 50자 정도를 썼던 기억이 납니다).