텍스트, 이미지, 비디오, 오디오 모델을 실행하기 위한 통합 API인 GMI Cloud Inference Engine 2.0 @gmi_cloud를 살펴보았습니다. 설정에 대한 번거로움이 없습니다. NVIDIA DGX Cloud Lepton과 GMI 클러스터 엔진을 통해 깔끔한 스케일링과 원활한 출력만 제공됩니다. 우리가 테스트한 내용은 다음과 같습니다.
성능 개선은 쉽게 눈에 띄었습니다. • 1.46배 더 빠른 추론 • 25~49% 더 높은 처리량 • 평균 V3 공급업체보다 71% 저렴 새로운 콘솔 UI 덕분에 배포가 간편해졌습니다. 인프라는 전혀 건드리지 않았습니다. 모든 것이 탄력적인 확장 기능을 갖춘 단일 API를 통해 실행됩니다.
우리는 Sora-2 Pro를 사용하여 GMI Cloud IE 2.0을 테스트하여 비디오 생성에 어떤 기능을 할 수 있는지 알아보았습니다. 우리가 만든 세 가지 예는 다음과 같습니다. 영화 같은 도쿄 거리, 코드를 수정하는 좀비 개발자, 새벽의 네온 도시입니다. 모든 데이터는 Sora-2 Pro를 사용하여 @gmi_cloud에서 직접 생성되었으며, 설정이나 사후 처리가 필요 없습니다.
우리는 GMI Cloud IE 2.0에서 Qwen3 Coder 480B A35B Instruct FP8을 테스트했습니다. FastAPI, MongoDB, JWT 인증, README, curl 테스트, Dockerfile을 모두 하나의 세션으로 통합하여 전체 구독 추적 스캐폴드를 구축했습니다. 빠르고 체계적이며 정확합니다.
신규 사용자는 Inference Engine 2.0을 체험할 수 있는 5달러 상당의 무료 크레딧을 받습니다. GMI 커뮤니티에 가입하세요: https:/discord.gg/mbYhCJSbF6 테스트를 시작하세요: https://t.co/h7zU2F1D8D
