X (Twitter)

Greptileは最近、「2025年AIプログラミングの現状レポート」を発表しました。同社は、PostHogやBrexといったスタースタートアップからフォーチュン500企業まで、幅広い顧客にAIコードレビューサービスを提供しています。毎月約10億行のコードがシステムを通過しており、豊富な一次データへのアクセスを可能にしています。レポートからいくつかの数値をご紹介します。開発者が毎月生成するコード行数は4,450行から7,839行に増加し、76%増加しました。プルリクエスト（PR）のサイズも拡大し、中央値は57行から76行に増加しました。中規模チームではこの増加はさらに顕著で、89%に達しました。実は以前、多くの人が生産性を測るのにコード行数を使いたがるのを不満に思ったことがあります。なぜなら、コードは資産ではなく負債だからです。コードが増えれば増えるほど、メンテナンスが難しくなります。AI生成コードが増えれば増えるほど、バグが増え、メンテナンスが難しくなります。 AIプログラミングツールのメリットは、非常に不均一です。テストカバレッジが良好でモジュール境界が明確なプロジェクトでは、AIは強力な資産となります。しかし、複雑なレガシーシステムや深いドメイン知識を必要とするシナリオでは、AIの活用範囲は限られ、逆効果になる場合もあります。しかし、いずれにせよ、AI がコードインフレを引き起こしているのは事実です。 AI によってコードの行数は増えますが、それによって品質は向上するのでしょうか? コード行数を数えるのは簡単ですが、コードの品質を測定するのははるかに難しいため、レポートでこれについて触れられていないのは残念です。レポート内のデータは今でも見る価値があります。ツールエコシステム分野では、ベクターデータベース市場は現在非常に競争が激しく、Weaviateが25%のシェアでトップに立っていますが、その他6～7社がそれぞれ10%から25%のシェアで僅差で追っており、勝敗はまだ不透明です。AIメモリパッケージでは、mem0が59%を占め、競合他社を大きく引き離しています。ルールファイルに関しては、CLAUDE.mdが67%の採用率でトップに立ち、多くの開発者がClaudeを使用してプログラム可能なインテリジェントエージェントを作成していることがわかります。 SDKダウンロード数の推移はさらに興味深いものです。OpenAIは依然として月間ダウンロード数1億3000万件で圧倒的なリードを維持しています。しかし、Anthropicの成長率は驚異的で、2023年4月から現在までに1547倍に増加し、4300万件で安定しています。OpenAIとAnthropicのダウンロード数比率は、2024年初頭の47:1から現在4.2:1へと縮小しています。GoogleのGenAI SDKは1360万件で、大きく後れを取っています。モデル性能比較セクションでは、GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5、Gemini 3 Proをテストしました。いくつかの注目すべき結果があります。最初のトークンの応答時間について、Anthropicの2つのモデルはどちらも2.5秒未満ですが、他の3つのモデルは2倍以上の時間がかかります。この数秒を過小評価しないでください。インタラクティブなプログラミングシナリオでは、長い待ち時間は思考の流れを中断させ、フローに再度戻らざるを得なくなる可能性があります。スループットに関しては、OpenAIの2つのモデルが最も高速で、中央値は60～70トークン/秒です。Anthropicは17～20トークン/秒、Geminiはわずか4～5トークン/秒です。ただし、高スループットが全てではありません。ユースケースで本当にその速度が必要かどうかも考慮する必要があります。コスト比較では、GPT-5 Codexを基準として1倍に設定しています。GPT-5.1も1倍、Gemini 3 Proは1.4倍、Claude Sonnet 4.5は2倍、Claude Opus 4.5は3.3倍です。Anthropicのモデルは大幅に高価ですが、多くのユーザーはコード品質が優れていると感じており、喜んで支払いをしています。本レポートは、DeepSeek-V3のMoEアーキテクチャ、ロングコンテキストとRAGのトレードオフ、MEM1の定数メモリ型インテリジェントエージェントフレームワークなど、いくつかの最近の研究成果を紹介して締めくくっています。このセクションは、プロの開発者向けの参考文献リストのようなもので、これ以上詳しく説明しません。

宝玉（@dotey）のスレッド

作者情報

スレッド内容