HOC / HVM / Bend の状態の概要: - 約1年前、私たちはBend1を立ち上げました - GPU 上でクロージャ + 高速オブジェクト アロケータを実行する最初の言語 - 10000コア以上でほぼ理想的なスピードアップ - 相互作用ネットの厳密なランタイムであるHVM2に基づく 問題点: - 解釈のオーバーヘッドは依然として大きい - 1 コアの OCaml / JavaScript などに勝つためのフル RTX 4090。 - 大きな実際的な制限(int24、IOなし、パッケージなし) - Pythonの構文にもかかわらず、使いにくい - ほとんどの開発者は再帰的に考えることができないことが判明 - 遅延評価と互換性がありません (β最適ではありません!!) 上記の問題に失望しました。同時に、シンボリックAIの礎となるプログラム合成の問題に最適評価を適用することについて、次第に楽観的な見通しが持て始めました。これは失敗したアイデアではありましたが、「きっと解決できる」という強い確信を持っていました。 私は決断しました。HVM2を捨て去り(💀)、私の「相互作用計算」をベースとし、β-最適性を備えたHVM1のルーツに立ち返ることです。HVM1を徹底的に磨き上げ、改良した結果、Haskellで書かれたプロトタイプであるHVM3が完成しました。その後、HVM3を用いて、最適評価器を用いたプログラム合成の理解と研究を行いました。これは大変な作業で、約1年を費やしましたが、結果は良好で、私たちのシステムは効率性と機能の両面で現在、公開されているあらゆる代替システムを凌駕しています。 現在、私たちは、ランタイム/コンパイラを生の C で実装することで、これらすべてを統合し、私たちの簡素な Mac Mini クラスター (🥹) 上で可能な限り効率的に実行し、API 経由で世界に提供できるようにしています。 10月までにリリースする予定でしたが、まだいくつか課題があり、予想以上に時間がかかっています。例えば、SupGenでLeanの証明を見つけるには、重ね合わせを非常に慎重に扱う必要があり、C言語でそれを行うのは実に困難です。しかし、作業は着実に進んでおり、既に多くの成果を上げています。Bend2 / HVM4は今年中、あるいは2026年第1四半期にリリースできると予想しています。 Bend2 には次の機能があります: - 遅延/最適モードによる並列 CPU ランタイム (!!!) - 16 / 32 / 64 ビットの int、uint、float(ついに) - 軽量 C 相互運用性による任意の IO (Zig など) - 時間がないのでまだCUDAはないが、実行可能だ - 最も重要なのは、SupGenの統合です SupGenはBend2の真髄とも言える新しい技術です。従来のAI*ではなく*、例と仕様に基づいてコードを生成できる全く新しいものです。純粋なシンボリック探索でこれほど多くのことが実現できることに、多くの人(特に深層学習の研究者)は全く驚かされるでしょう。そして何よりも、その反応を見るのが待ちきれません。
また、言及し忘れた点: - Bend2はJavaScript / Haskellにエクスポートされるため、Bendのエコシステムでのサポートを待たずに通常のアプリを作成できます。 - 残念ながら、Bend2 は「並列実行可能な場合は並列実行する」という約束を破ってしまいます。これは、この約束が *明らかに* 遅延評価と互換性がないためです(式が可視かどうか確認するまで待つか、並列で縮約するかのどちらかです。両方を同時に実現することはできません)。将来的には、HVM2 の直接アップデートとして完全な厳密モードを提供したいと考えていますが、時間が限られているため、今はその点に注力していません。明るい面としては、GPU で遅延モードを実行できるようになると考えています。実際には、これは完全な厳密並列性よりもはるかに優れていると考えています。 - WeFunderキャンペーンはまだアクティブですが、私は積極的にフォローしていません。開始後に終了します。