Q:目前為止,FP32 核心擴充相當容易實現,基本上就是用 C 語言寫程式碼。那麼,如何才能最輕鬆地實現對 TF32、FP16 和 BF16 的支持,而不會搞得一團糟呢?
Q:我的直覺是除非絕對必要,否則盡量避免使用額外的函式庫。例如,就我目前所見,我真的非常不喜歡 Triton(雖然如果它能一次性生成內核,然後我可以將其靜態包含到我的項目中,我會更滿意)。我的確需要對瓦片大小做一些調整。該怎麼做?
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月7日 下午1:09
Q:目前為止,FP32 核心擴充相當容易實現,基本上就是用 C 語言寫程式碼。那麼,如何才能最輕鬆地實現對 TF32、FP16 和 BF16 的支持,而不會搞得一團糟呢?
Q:我的直覺是除非絕對必要,否則盡量避免使用額外的函式庫。例如,就我目前所見,我真的非常不喜歡 Triton(雖然如果它能一次性生成內核,然後我可以將其靜態包含到我的項目中,我會更滿意)。我的確需要對瓦片大小做一些調整。該怎麼做?