수백 개의 추가 CUDA 동기화가 어디서 나오는지 알아내려고 한 시간을 보냈습니다... 진짜 짜증나... // 파이썬 버전과의 차이점 : 파이썬 버전과 달리 // 유한성 검사를 건너뜁니다(error_if_nonfinite = false), 이 함수 // 장치 CPU 동기화를 도입합니다(장치가 있는 경우) // 의미!) CPU 측 `double`을 반환하기 위해서입니다. 따라서 이 C++ 버전은 // 그래디언트 장치에 대해 완전히 비동기적으로 실행할 수 없습니다.
아무 이유 없이 동기화가 되지 않았습니다... 여기서 수정했습니다.
