Greptile 剛發布了一份《2025 年AI 編程現狀報告》,這家公司是做AI 代碼審查的,客戶從PostHog、Brex 這樣的明星創業公司到財富500 強都有。每個月大約有十億行程式碼經過他們的系統,所以他們手上有不少一手資料。 摘錄報告中的一組數字:開發者每月產出的程式碼行數從4,450 行漲到了7,839 行,漲幅76%。 PR 的體積也在膨脹,中位數從57 行漲到76 行。中型團隊的增幅更誇張,達到89%。 其實我以前就吐槽過很多人喜歡用程式碼行數去衡量生產力,因為程式碼不是資產是負債,程式碼越多代表越難維護,AI 產生的程式碼多,也意味著更難維護Bug 更多了。 AI 程式設計工具的效益分佈極不均。在已經有良好測試覆蓋、模組邊界清晰的項目裡,AI 如虎添翼。但在複雜的遺留系統、需要深度領域知識的場景下,它的幫助有限甚至可能幫忙。 但不管怎麼說,現在AI 讓代碼通貨膨脹已經是事實。 AI 讓程式碼行數增加了,那麼品質有變好嗎? 很遺憾報告沒有提這事,畢竟程式碼行好統計,程式碼品質可不好衡量。 報告裡的數據還是可以看看。 工俱生態那部分,向量資料庫市場目前群雄逐鹿,Weaviate 以25% 份額領先,但後面跟著六、七家都在10%-25% 之間,還沒分出勝負。 AI 記憶包裡mem0 佔了59%,遙遙領先。規則檔方面,CLAUDE .md 以67% 的採用率登頂,顯示用Claude 做程式設計智能體的開發者確實不少。 SDK 下載量的變化趨勢更有意思。 OpenAI 還是絕對領先,每月下載1.3 億次。但Anthropic 的成長速度驚人,從2023 年4 月到現在成長了1547 倍,現在穩定在4,300 萬。 OpenAI 與Anthropic 的下載比例從2024 年初的47:1 縮小到了現在的4.2:1。 Google 的GenAI SDK 還在1360 萬,落後明顯。 模型效能比較那部分,測試了GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5 和Gemini 3 Pro。幾個發現值得注意。 首token 反應時間,Anthropic 的兩款模型都在2.5 秒以內,其他三個則要兩倍以上。別小看這幾秒——在互動式程式設計場景下,等待時間長了你的思緒就斷了,得重新進入狀態。 吞吐量方面,OpenAI 的兩款模型最快,中位數能到60-70 tokens/秒。 Anthropic 在17-20 之間,Gemini 只有4-5。但吞吐量高不代表一切,還得看你的使用場景是不是真是需要那麼快。 成本比較以GPT-5 Codex 為基準設為1x,GPT-5.1 也是1x,Gemini 3 Pro 是1.4x,Claude Sonnet 4.5 是2x,Claude Opus 4.5 是3.3x。 Anthropic 的模型明顯更貴,但許多用戶覺得程式碼品質更好,願意為此付費。 報告最後介紹了一批最新研究,包括DeepSeek-V3 的MoE 架構、長上下文vs RAG 的取捨、MEM1 的恆定記憶體智能體框架等等。這部分更像是給專業開發者的閱讀清單,不展開了。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
