[オープンソース推奨事項] CodeWiki: 大規模な多言語コード リポジトリ用の完全で構造化されたアーキテクチャ対応のドキュメントを自動的に生成するオープンソース フレームワーク。 ⚠️これは Google Codewiki ではないことにご注意ください⚠️ 従来のコードドキュメントツールやAIツールは、通常、関数/ファイルレベルのみに焦点を当てているため、ファイル、モジュール、さらにはシステム全体にわたる相互作用を捉えることが困難です。数十万行、あるいは数百万行ものコードを含む実際のプロジェクトでは、手作業によるドキュメント作成は非常にコストがかかります。また、既存の自動ツールは、全体的なアーキテクチャの視点を欠いた断片的なコンテンツを生成することがよくあります。 CodeWiki は、この問題点を解決するために設計されています。高レベルのアーキテクチャの概要、モジュール間の依存関係、データフロー、シーケンス図、使用例などを含む、「プロジェクト wiki」に似たコード リポジトリ全体の完全なドキュメントを生成でき、マルチモーダル出力 (テキスト + インタラクティブな Mermaid チャート) をサポートします。 主なイノベーション(3つのコア技術) 1. 階層的分解は、動的プログラミングの考え方を利用して、巨大なウェアハウスを複数の「モジュール クラスター」にインテリジェントに分割します。これにより、アーキテクチャのコンテキストが維持されるだけでなく、各サブタスクのサイズも制御可能になります (86,000 ~ 140 万行のコードをサポートすることが検証されています)。 2. 再帰的マルチエージェント処理は、複数のエージェント間の連携を活用します。単純なモジュールは直接生成され、複雑なモジュールは動的に分解されてサブエージェントに処理を委譲されます。これにより、大規模なリポジトリでも高品質とスケーラビリティが確保されます。これは「セミエージェント」設計であり、単一のLLM呼び出しよりも堅牢です。 3. マルチモーダル合成によって出力される最終文書には、Markdown テキストだけでなく、以下の内容も自動的に埋め込まれます。 • アーキテクチャ図 • データフローグラフ/依存グラフ • シーケンス図 • APIリファレンス、使用例など パフォーマンスメトリクス(論文のベンチマークCodeWikiBenchより) • Claude などのクローズドソース モデルを使用: 平均品質スコアは 68.79% で、クローズドソースの商用ツール DeepWiki よりも 4.73% 高くなっています。 特にPython/JS(+10.47%)などの高級言語で改善が顕著です。 • オープンソース モデルでは ~64.8% も達成でき、これは従来のベースラインを大幅に上回ります。 オープンソースアドレス:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
![[オープンソース推奨事項] CodeWiki: 大規模な多言語コード リポジトリ用の完全で構造化されたアーキテクチャ対応のドキュメントを自動的に生成するオープンソース フレームワーク。
⚠️これは Google Codewiki ではな](https://pbs.twimg.com/media/G6ayL3kaMAAYnyX.jpg)