X (Twitter)

Greptile 剛發布了一份《2025 年AI 編程現狀報告》，這家公司是做AI 代碼審查的，客戶從PostHog、Brex 這樣的明星創業公司到財富500 強都有。每個月大約有十億行程式碼經過他們的系統，所以他們手上有不少一手資料。摘錄報告中的一組數字：開發者每月產出的程式碼行數從4,450 行漲到了7,839 行，漲幅76%。 PR 的體積也在膨脹，中位數從57 行漲到76 行。中型團隊的增幅更誇張，達到89%。其實我以前就吐槽過很多人喜歡用程式碼行數去衡量生產力，因為程式碼不是資產是負債，程式碼越多代表越難維護，AI 產生的程式碼多，也意味著更難維護Bug 更多了。 AI 程式設計工具的效益分佈極不均。在已經有良好測試覆蓋、模組邊界清晰的項目裡，AI 如虎添翼。但在複雜的遺留系統、需要深度領域知識的場景下，它的幫助有限甚至可能幫忙。但不管怎麼說，現在AI 讓代碼通貨膨脹已經是事實。 AI 讓程式碼行數增加了，那麼品質有變好嗎？很遺憾報告沒有提這事，畢竟程式碼行好統計，程式碼品質可不好衡量。報告裡的數據還是可以看看。工俱生態那部分，向量資料庫市場目前群雄逐鹿，Weaviate 以25% 份額領先，但後面跟著六、七家都在10%-25% 之間，還沒分出勝負。 AI 記憶包裡mem0 佔了59%，遙遙領先。規則檔方面，CLAUDE .md 以67% 的採用率登頂，顯示用Claude 做程式設計智能體的開發者確實不少。 SDK 下載量的變化趨勢更有意思。 OpenAI 還是絕對領先，每月下載1.3 億次。但Anthropic 的成長速度驚人，從2023 年4 月到現在成長了1547 倍，現在穩定在4,300 萬。 OpenAI 與Anthropic 的下載比例從2024 年初的47:1 縮小到了現在的4.2:1。 Google 的GenAI SDK 還在1360 萬，落後明顯。模型效能比較那部分，測試了GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5 和Gemini 3 Pro。幾個發現值得注意。首token 反應時間，Anthropic 的兩款模型都在2.5 秒以內，其他三個則要兩倍以上。別小看這幾秒——在互動式程式設計場景下，等待時間長了你的思緒就斷了，得重新進入狀態。吞吐量方面，OpenAI 的兩款模型最快，中位數能到60-70 tokens/秒。 Anthropic 在17-20 之間，Gemini 只有4-5。但吞吐量高不代表一切，還得看你的使用場景是不是真是需要那麼快。成本比較以GPT-5 Codex 為基準設為1x，GPT-5.1 也是1x，Gemini 3 Pro 是1.4x，Claude Sonnet 4.5 是2x，Claude Opus 4.5 是3.3x。 Anthropic 的模型明顯更貴，但許多用戶覺得程式碼品質更好，願意為此付費。報告最後介紹了一批最新研究，包括DeepSeek-V3 的MoE 架構、長上下文vs RAG 的取捨、MEM1 的恆定記憶體智能體框架等等。這部分更像是給專業開發者的閱讀清單，不展開了。

來自宝玉（@dotey）的推文串

作者資訊

推文串內容