LichtFeld Studio에서 최초로 완전히 ML 프레임워크가 없는 3D 가우시안 스플래팅을 구현했습니다. 전체 학습 파이프라인을 커스텀 CUDA 기반 텐서 라이브러리로 마이그레이션했습니다. PyTorch, LibTorch, Autograd는 사용하지 않습니다. 모든 그래디언트는 CUDA 커널이나 그 위에 최소한의 추상화를 통해 수동으로 구현됩니다. 이를 통해 기존 ML 프레임워크에 대한 종속성이 전혀 없는 3D 가우시안 스플래팅을 위한 최초의 완전한 교육 설정이 탄생했습니다. 독립성만이 중요한 것이 아니라 통제력도 중요합니다! 이제 GPU 메모리의 모든 바이트를 관리하여 더욱 엄격한 최적화와 세밀한 성능 튜닝이 가능해졌습니다. 프레임워크 사용량은 최소화되었으며, 실시간 또는 그래픽 기반 애플리케이션용으로 설계되지 않은 기가바이트 단위의 ML 런타임 코드를 가져오지 않습니다. 메트릭 및 3DGUT 인터페이스와 같은 몇몇 모듈은 아직 이식 중이며, 일부 작업은 일시적으로 단순하기 때문에 성능이 아직 마스터 수준과 동일하지 않습니다. 하지만 이 리팩터링은 다음의 기반을 마련해줍니다. - 완전히 독립된 바이너리 - 세분화된 메모리 최적화 - ML 스택의 무게 없이 더 쉬운 실험 우리는 가까워지고 있어요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.