花了一個小時試圖弄清楚幾百個額外的 CUDA 同步是從哪裡來的……真是太費力了…… // 與 Python 版本的差異:與 Python 版本不同,即使 // 跳過有限性檢查(error_if_nonfinite = false),此函數 // 將引入裝置與 CPU 的同步(適用於需要同步的裝置) // 有意義! )以便傳回 CPU 端的 `double` 類型。因此,這個 C++ 版本 // 無法相對於漸層設備完全非同步運作。
它莫名其妙地開始同步了…已修復
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月25日 凌晨12:04
花了一個小時試圖弄清楚幾百個額外的 CUDA 同步是從哪裡來的……真是太費力了…… // 與 Python 版本的差異:與 Python 版本不同,即使 // 跳過有限性檢查(error_if_nonfinite = false),此函數 // 將引入裝置與 CPU 的同步(適用於需要同步的裝置) // 有意義! )以便傳回 CPU 端的 `double` 類型。因此,這個 C++ 版本 // 無法相對於漸層設備完全非同步運作。
它莫名其妙地開始同步了…已修復