X (Twitter)

키미는 K2-Thinking을 오픈소스로 공개해 모두를 깜짝 놀라게 했습니다! HLE(44.9)와 IMO(76.8)가 세계 최고입니다! 가능한 한 빨리 시도해 보았고, 이 기회를 빌려 그들의 전체 프로그래밍 제품군(모델, CLI, 멤버십)을 소개하고 싶습니다. 자세한 사용 지침과 테스트는 다음과 같습니다.👇

공사를 기다리기 너무 귀찮으신mp.weixin.qq.com/s/54qHLvw2VK3r…ttps://t.co/rFJAwyOrNa

먼저 모델의 업그레이드 세부 사항을 소개해드리겠습니다. 에이전트 기반 업그레이드: 기본적으로 "동시에 생각하고 도구를 사용"할 수 있으며, 최대 약 300라운드까지 자율적이고 지속적인 다중 라운드 추론 및 호출이 가능합니다. 최첨단 추론(SOTA): HLE(44.9)와 IMO(76.8)는 복잡한 검색 및 장기 계획에서 상당한 개선을 이루면서 지금까지 가장 높은 점수를 달성했습니다. 향상된 프로그래밍: 에이전트 코딩이 더 안정적이며, 프런트엔드(HTML/React/컴포넌트 기반) 및 다국어 프로젝트의 벤치마크 성능이 향상되었습니다. 업그레이드된 일반 기본 역량: 창의적 글쓰기가 더 리드미컬하고 심도 있게 진행됩니다. 학술 및 연구 시나리오에 대한 분석이 더 엄격해지고 구조가 더 명확해졌습니다. 장문 과제에서도 논리와 스타일이 안정적으로 유지됩니다. 효율성 개선: 네이티브 INT4(QAT+MoE 가중치만 해당)는 장시간 디코딩에서도 성능을 유지하며, 생성 속도가 약 2배 향상되었습니다.

또한 이 기간 동안 키미는 프로그래밍 분야의 모델에만 집중한 것이 아니라 주변 생태계를 고려하고 모든 사람이 K2 프로그래밍을 보다 편리하고 저렴하게 사용할 수 있도록 하는 방법에 대해서도 고민했습니다. 그들은 설치가 쉽고 기본적인 라치오 클로드 코드를 사용하는 자체 AI 프로그래밍 CLI 도구인 Kimi CLI를 출시했습니다. 또한 KFC라는 API 패키지도 추가했는데, 비용은 199위안으로 주당 7,168건의 통화를 제공하는데, 이는 충분한 수준입니다.

먼저, Kimi 소프트웨어 제품군을 통해 업그레이드된 K2-Thinking 모델을 쉽고 빠르게 사용하는 방법을 살펴보겠습니다. 키미 아폴로 프로그램 멤버십을 구매해야 하는데, 이는 공식 웹사이트에서 직접 구매할 수 있습니다. 게다가 이전에 키미에게 팁을 준 적이 있다면, 서비스를 처음 활성화한 후에 팁으로 받은 금액이 계좌에 적립되는데, 이는 매우 관대한 혜택입니다. 디자인 문제가 있습니다. Kimi For Coding API 키를 받으시려면 아래 이미지에 강조 표시된 텍스트를 클릭하여 복사해야 합니다. 나중에 설정에 추가하는 등의 방법으로 이 부분을 변경할 수 있기를 바랍니다.

이제 Kimi CLI를 설치할 수 있습니다. UV를 설치하지 않았다면 먼저 터미널에 UV를 설치해야 합니다. 그러면 이 코드를 사용하여 Kimi CLI를 설치할 수 있습니다. uv 도구 설치 --python 3.13 kimi-cli 설치 후 터미널에서 프로젝트 디렉토리를 열고 "kimi"를 입력하여 Kimi CLI를 시작합니다. 처음 실행하면 로그인 방법을 선택하라는 메시지가 표시됩니다. 첫 번째 옵션을 선택하고 KFC에서 방금 받은 API 키를 입력하세요. 안으로 들어가면 Tab 키를 눌러 사고력을 활성화하세요. 이 시점에서는 K2-사고 모델이 사용됩니다. Claude Code에서도 동일한 방식으로 사고력을 활성화할 수 있습니다.

물론, 이는 Cluade Code에서도 여전히 사용될 수 있습니다. 환경 변수 설정이 번거로우시다면 제 "ai-claude-start" 프로젝트를 사용하세요. 프로젝트를 생성할 때 다음 정보를 입력하세요.

다음은 모델 테스트입니다. 먼저 Todo 웹 애플리케이션에 대한 기본 요구 사항을 제안한 후, 지속적으로 추가 기능을 추가, 수정하고 요청하며 10번의 수정 과정을 거친 후 결과를 살펴보겠습니다. 보시다시피, 이는 초기의 기본적인 Todo 앱에서 점진적으로 기능을 추가하여 결국 거의 완전한 제품이 되는 과정입니다. 요구 사항이 진행됨에 따라 드래그 앤 드롭 기능 및 모바일 환경에 맞춰 대대적인 개편 등 점점 더 복잡해졌습니다. 새로운 기능 추가로 인해 UI가 변경되었지만, K2-Thinking은 이 모든 문제를 한 번에 해결했습니다. 세 번째, 새로운 기능 추가로 인해 발생한 UI 문제가 네 번째에서 해결되었는데, 정말 멋진 일이었습니다.

다른 모델로도 이 테스트를 시도해 봤습니다. Claude 4.5는 작동했지만 Codex는 작동하지 않았습니다. 아래는 일곱 번째 수정 후 Codex CLI의 모습입니다. 매우 암울한 그림입니다. 제품은 사실상 사용할 수 없을 정도로 망가졌고, 그는 그것을 망쳐버렸습니다.

다음은 Kimi의 CLI 검색 기술 테스트입니다. Linear 제품의 홈페이지 디자인 스타일을 검색한 다음, 해당 제품 웹페이지의 디자인 스타일을 복제하는 웹페이지를 작성합니다. 그는 실제로 검색 도구를 사용하여 선형 디자인에 대한 몇 가지 기사를 찾은 다음 선형 디자인의 디자인 특징을 요약하고 원래의 프롬프트와 요구 사항을 확장했습니다. 가장 어려웠던 부분은 카드에 마우스를 올려놓았을 때 나타나는 자석 버튼과 빛 효과였는데, 이는 이전 Linear의 핵심 디자인 요소이기도 했지만, 그는 이 모든 것을 해결했습니다. Claude Code에서 이 힌트를 사용해 Claude 4.5를 작동시키려고 시도했지만, Claude 4.5에서도 자석 버튼 애니메이션과 마우스 호버 그래디언트 효과가 작동하지 않았습니다.

다음 테스트에서는 복잡한 비즈니스 로직을 살펴보겠습니다. 드래그와 클릭 사이의 충돌, 연결이 구성 요소에 바인딩되는 것과 같은 많은 상호 작용적인 논리적 충돌과 함정을 숨기는 플로차트 도구를 만들어 달라고 요청하세요. 선을 끌어서 연결할 때 쉽게 발생할 수 있는 충돌 문제와 관련하여 이 똑똑한 사람은 간단히 모드 전환 버튼을 만들어서 문제를 해결했습니다. 전선을 연결할 때 기능은 정상적으로 작동하며, 경로는 빙빙 돌지 않고 합리적입니다. 동시에 논리적 판단 노드는 자동으로 예/아니오 라벨을 추가합니다. 사고 능력을 습득한 후에는 이처럼 복잡한 논리를 함정 없이 잘 처리할 수 있는 것으로 보입니다.

다음 단계는 API를 처리하고, 데이터를 검색하고, 시각화하는 능력을 테스트하는 것이었는데, 이를 통해 그는 높은 시각화 요구 사항이 있는 블록체인 대시보드를 만들게 되었습니다. 결과는 실행이 매우 잘 진행되었음을 보여줍니다. 데이터를 검색하기 위해 올바른 API가 호출되었고, 필요한 시각화 주석과 정렬이 구현되었습니다. 자세한 데이터를 클릭하면 나타나는 자세한 선형 차트도 추가되었고, 확장/축소 애니메이션과 자세한 호버 데이터도 추가되었습니다.

마지막으로, 몇 가지 문제가 있는 코드가 있습니다. 이 문제를 파악하고 해결할 수 있는지 살펴보겠습니다. 또 다른 AI에게 5개의 질문이 적힌 웹페이지를 작성하게 했는데, 한 번에 엄청난 양의 질문을 렌더링해서 지연 문제를 해결하고 검색 속도를 개선하려고 했습니다. 재밌는 점은 그가 문제를 해결했을 뿐만 아니라 성능 모니터링 구성 요소도 추가했다는 것입니다. 이를 통해 웹 페이지를 실행하고 테스트할 때 실시간으로 수정된 데이터의 세부 정보를 볼 수 있었고, 인식이 아닌 데이터로부터 효과를 볼 수 있었습니다.

달의 어두운 면은 중국의 여섯 마리 작은 용 중 하나이지만, 전 세계적으로 OpenAI의 0.5%, Anthropic의 2%에 불과한 가치를 가지고 있습니다. 이 소규모 국내 회사는 매우 어려운 시험 세트에서 최첨단(SOTA) 점수 두 개를 만들어냈는데, 이는 국내 또는 오픈 소스 SOTA 점수가 아니라 글로벌 SOTA 점수입니다! 해당 게시물이 게시되기 전, 해당 트윗 아래에 많은 해외 사용자들의 생각을 반영하는 댓글을 봤습니다. 최근에도 비슷한 내용을 여러 번 봤습니다.

歸藏(guizang.ai)(@op7418)의 스레드

작성자 정보

스레드 내용