LogoThread Easy
  • Explorer
  • Composer un thread
LogoThread Easy

Votre partenaire tout-en-un pour les threads Twitter

© 2025 Thread Easy All Rights Reserved.

Explorer

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

RT @merinsay: @julesyoo and @JayRughani immediately understood the immense opportunity that lies in building a new operating system for car…

RT @merinsay: @julesyoo and @JayRughani immediately understood the immense opportunity that lies in building a new operating system for car…

Partner @a16z investing in healthcare technology. Prev @flatironhealth (acq by @roche for ~$2b) & @deloittehealth. Professional student.

avatar for Jay Rughani
Jay Rughani
Thu Dec 18 06:25:29
Big Bench Audio 智能基准测试:在音频推理基准测试中,Grok 排名第1。

智能得分: 95%(领先所有竞争对手)

响应速度: 平均 time-to-first-audio < 1 秒,比最近的竞争对手快约5倍。

在线体验:https://t.co/AbSskmXvhu

详细介绍:https://t.co/yzASWYOgSs

Big Bench Audio 智能基准测试:在音频推理基准测试中,Grok 排名第1。 智能得分: 95%(领先所有竞争对手) 响应速度: 平均 time-to-first-audio < 1 秒,比最近的竞争对手快约5倍。 在线体验:https://t.co/AbSskmXvhu 详细介绍:https://t.co/yzASWYOgSs

带你了解全球最前沿科技、AI动态... 学AI找小互,找小互,上 https://t.co/4PVaHEr5r3 ... 小互AI日报 社群:https://t.co/LIEXfWUHv1

avatar for 小互
小互
Thu Dec 18 06:17:41
RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮,
我通常会先帮一个小忙,可能只花我几分钟,
如果对方一直记得,特别感激,
那我就愿意继续帮他,
因为大部分时候,帮对了人,就是双赢和共赢。

RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮, 我通常会先帮一个小忙,可能只花我几分钟, 如果对方一直记得,特别感激, 那我就愿意继续帮他, 因为大部分时候,帮对了人,就是双赢和共赢。

独立开发者 | 个人IP教练 | 帮助新手在X上完成早期成长| 公众号:PandaTalk8

avatar for Mr Panda
Mr Panda
Thu Dec 18 06:17:36
Greptile 刚发布了一份《2025 年 AI 编程现状报告》,这家公司是做 AI 代码审查的,客户从 PostHog、Brex 这样的明星创业公司到财富 500 强都有。每月大约有十亿行代码经过他们的系统,所以他们手上有不少一手数据。

摘录报告中的一组数字:开发者每月产出的代码行数从 4,450 行涨到了 7,839 行,涨幅 76%。PR 的体积也在膨胀,中位数从 57 行涨到 76 行。中型团队的增幅更夸张,达到 89%。

其实我以前就吐槽过很多人喜欢用代码行数去衡量生产力,因为代码不是资产是负债,代码越多意味着越难维护,AI 生成的代码多,也意味着更难维护 Bug 更多了。

AI 编程工具的收益分布极不均匀。在已经有良好测试覆盖、模块边界清晰的项目里,AI 如虎添翼。但在复杂的遗留系统、需要深度领域知识的场景下,它的帮助有限甚至可能帮倒忙。

但不管怎么说,现在 AI 让代码通货膨胀已经是事实。

AI 让代码行数增加了,那么质量有变好吗?

很遗憾报告没有提这事,毕竟代码行好统计,代码质量可不好衡量。

报告里的数据还是可以看看。

工具生态那部分,向量数据库市场目前群雄逐鹿,Weaviate 以 25% 份额领先,但后面跟着六七家都在 10%-25% 之间,还没分出胜负。AI 记忆包里 mem0 占了 59%,遥遥领先。规则文件方面,CLAUDE .md 以 67% 的采用率登顶,说明用 Claude 做编程智能体的开发者确实不少。

SDK 下载量的变化趋势更有意思。OpenAI 还是绝对领先,月下载 1.3 亿次。但 Anthropic 的增速惊人,从 2023 年 4 月到现在增长了 1547 倍,现在稳定在 4300 万。OpenAI 与 Anthropic 的下载比例从 2024 年初的 47:1 缩小到了现在的 4.2:1。Google 的 GenAI SDK 还在 1360 万,落后明显。

模型性能对比那部分,测试了 GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5 和 Gemini 3 Pro。几个发现值得注意。

首 token 响应时间,Anthropic 的两款模型都在 2.5 秒以内,其他三个要两倍以上。别小看这几秒——在交互式编程场景下,等待时间长了你的思路就断了,得重新进入状态。

吞吐量方面,OpenAI 的两款模型最快,中位数能到 60-70 tokens/秒。Anthropic 在 17-20 之间,Gemini 只有 4-5。但吞吐量高不代表一切,还得看你的使用场景是不是真需要那么快。

成本对比以 GPT-5 Codex 为基准设为 1x,GPT-5.1 也是 1x,Gemini 3 Pro 是 1.4x,Claude Sonnet 4.5 是 2x,Claude Opus 4.5 是 3.3x。Anthropic 的模型明显更贵,但很多用户觉得代码质量更好,愿意为此付费。

报告最后介绍了一批最新研究,包括 DeepSeek-V3 的 MoE 架构、长上下文 vs RAG 的取舍、MEM1 的恒定内存智能体框架等等。这部分更像是给专业开发者的阅读清单,不展开了。

Greptile 刚发布了一份《2025 年 AI 编程现状报告》,这家公司是做 AI 代码审查的,客户从 PostHog、Brex 这样的明星创业公司到财富 500 强都有。每月大约有十亿行代码经过他们的系统,所以他们手上有不少一手数据。 摘录报告中的一组数字:开发者每月产出的代码行数从 4,450 行涨到了 7,839 行,涨幅 76%。PR 的体积也在膨胀,中位数从 57 行涨到 76 行。中型团队的增幅更夸张,达到 89%。 其实我以前就吐槽过很多人喜欢用代码行数去衡量生产力,因为代码不是资产是负债,代码越多意味着越难维护,AI 生成的代码多,也意味着更难维护 Bug 更多了。 AI 编程工具的收益分布极不均匀。在已经有良好测试覆盖、模块边界清晰的项目里,AI 如虎添翼。但在复杂的遗留系统、需要深度领域知识的场景下,它的帮助有限甚至可能帮倒忙。 但不管怎么说,现在 AI 让代码通货膨胀已经是事实。 AI 让代码行数增加了,那么质量有变好吗? 很遗憾报告没有提这事,毕竟代码行好统计,代码质量可不好衡量。 报告里的数据还是可以看看。 工具生态那部分,向量数据库市场目前群雄逐鹿,Weaviate 以 25% 份额领先,但后面跟着六七家都在 10%-25% 之间,还没分出胜负。AI 记忆包里 mem0 占了 59%,遥遥领先。规则文件方面,CLAUDE .md 以 67% 的采用率登顶,说明用 Claude 做编程智能体的开发者确实不少。 SDK 下载量的变化趋势更有意思。OpenAI 还是绝对领先,月下载 1.3 亿次。但 Anthropic 的增速惊人,从 2023 年 4 月到现在增长了 1547 倍,现在稳定在 4300 万。OpenAI 与 Anthropic 的下载比例从 2024 年初的 47:1 缩小到了现在的 4.2:1。Google 的 GenAI SDK 还在 1360 万,落后明显。 模型性能对比那部分,测试了 GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5 和 Gemini 3 Pro。几个发现值得注意。 首 token 响应时间,Anthropic 的两款模型都在 2.5 秒以内,其他三个要两倍以上。别小看这几秒——在交互式编程场景下,等待时间长了你的思路就断了,得重新进入状态。 吞吐量方面,OpenAI 的两款模型最快,中位数能到 60-70 tokens/秒。Anthropic 在 17-20 之间,Gemini 只有 4-5。但吞吐量高不代表一切,还得看你的使用场景是不是真需要那么快。 成本对比以 GPT-5 Codex 为基准设为 1x,GPT-5.1 也是 1x,Gemini 3 Pro 是 1.4x,Claude Sonnet 4.5 是 2x,Claude Opus 4.5 是 3.3x。Anthropic 的模型明显更贵,但很多用户觉得代码质量更好,愿意为此付费。 报告最后介绍了一批最新研究,包括 DeepSeek-V3 的 MoE 架构、长上下文 vs RAG 的取舍、MEM1 的恒定内存智能体框架等等。这部分更像是给专业开发者的阅读清单,不展开了。

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

avatar for 宝玉
宝玉
Thu Dec 18 06:16:45
Why are people crashing out on the “Asian female & white male” combo in particular,

but not so much at other combos like “Asian male & white female” / “Asian female & white female” / “Asian male & white male” / etc?

Genuinely curious…

Why are people crashing out on the “Asian female & white male” combo in particular, but not so much at other combos like “Asian male & white female” / “Asian female & white female” / “Asian male & white male” / etc? Genuinely curious…

“The woman scooping Silicon Valley” — BBC・hacker turned builder, blogger & consultant・ex: Threads, Instagram, etc

avatar for Jane Manchun Wong
Jane Manchun Wong
Thu Dec 18 06:16:14
现在,全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。

在车上,Grok 不仅能听懂你说什么,还能直接操作车辆系统:

查询电池、电量、车况
规划路线
从 X 上搜索内容
自动生成旅行计划(路线 + 停靠点 + 沿途推荐)

现在,全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。 在车上,Grok 不仅能听懂你说什么,还能直接操作车辆系统: 查询电池、电量、车况 规划路线 从 X 上搜索内容 自动生成旅行计划(路线 + 停靠点 + 沿途推荐)

Big Bench Audio 智能基准测试:在音频推理基准测试中,Grok 排名第1。 智能得分: 95%(领先所有竞争对手) 响应速度: 平均 time-to-first-audio < 1 秒,比最近的竞争对手快约5倍。 在线体验:https://t.co/AbSskmXvhu 详细介绍:https://t.co/yzASWYOgSs

avatar for 小互
小互
Thu Dec 18 06:15:49
  • Previous
  • 1
  • More pages
  • 451
  • 452
  • 453
  • More pages
  • 5634
  • Next