Q: 今のところ、fp32 のカーニングはかなり簡単です。C言語で書くだけで済みます。面倒な手間をかけずに TF32、FP16、BF16 をサポートする最も簡単な方法は何でしょうか?
Q: どうしても必要な場合を除いて、余分なライブラリは避けるのが私の本能です。例えば、Tritonは見た限りでは本当に好きになれません(ただし、カーネルを一度生成して、それをプロジェクトに静的に組み込めるようになれば、それほど気にならなくなるでしょう)。タイルのサイズをある程度調整する必要があるのですが、どうすればいいでしょうか?