InfiniBand を詳しく調べて、それを理解するにはクライアント/サーバーのペアを一から書く必要があることに気付きました。 Pythonでできることがわかりました!Linux rdma-coreは、pyverbsで必要なすべてのInfiniBand verbを提供します 単純なRDMA書き込み+読み取りの例です
InfiniBandのソケットに相当するもの(「キューペア」)を作成した後、ピアは情報(メモリにアクセスするためのキーなど)を交換する必要があります。 これは通常TCPで行われますが、TCPは頭が痛くなるので、Modal Dict(リモートKVストレージ)を使用しました。 https://t.co/PPqVohm7Nl
コードはここにあります - 閲覧、解説、ハッキング用です。 これは Modal 上で実行され、実験的な RDMA クラスター機能を使用します。 RDMA加速推論やトレーニングの実行に興味がある場合は、アクセスを申請してください。 https://t.co/2pZWAU9spB

