Explorer

RT @merinsay: @julesyoo and @JayRughani immediately understood the immense opportunity that lies in building a new operating system for car…

Partner @a16z investing in healthcare technology. Prev @flatironhealth (acq by @roche for ~$2b) & @deloittehealth. Professional student.

Jay Rughani

Thu Dec 18 06:25:29

Big Bench Audio 智能基准测试：在音频推理基准测试中，Grok 排名第1。智能得分： 95%（领先所有竞争对手）响应速度：平均 time-to-first-audio < 1 秒，比最近的竞争对手快约5倍。在线体验：https://t.co/AbSskmXvhu 详细介绍：https://t.co/yzASWYOgSs

带你了解全球最前沿科技、AI动态... 学AI找小互，找小互，上 https://t.co/4PVaHEr5r3 ... 小互AI日报社群：https://t.co/LIEXfWUHv1

小互

Thu Dec 18 06:17:41

RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮，我通常会先帮一个小忙，可能只花我几分钟，如果对方一直记得，特别感激，那我就愿意继续帮他，因为大部分时候，帮对了人，就是双赢和共赢。

独立开发者｜个人IP教练｜帮助新手在X上完成早期成长｜公众号：PandaTalk8

Mr Panda

Thu Dec 18 06:17:36

Greptile 刚发布了一份《2025 年 AI 编程现状报告》，这家公司是做 AI 代码审查的，客户从 PostHog、Brex 这样的明星创业公司到财富 500 强都有。每月大约有十亿行代码经过他们的系统，所以他们手上有不少一手数据。摘录报告中的一组数字：开发者每月产出的代码行数从 4,450 行涨到了 7,839 行，涨幅 76%。PR 的体积也在膨胀，中位数从 57 行涨到 76 行。中型团队的增幅更夸张，达到 89%。其实我以前就吐槽过很多人喜欢用代码行数去衡量生产力，因为代码不是资产是负债，代码越多意味着越难维护，AI 生成的代码多，也意味着更难维护 Bug 更多了。 AI 编程工具的收益分布极不均匀。在已经有良好测试覆盖、模块边界清晰的项目里，AI 如虎添翼。但在复杂的遗留系统、需要深度领域知识的场景下，它的帮助有限甚至可能帮倒忙。但不管怎么说，现在 AI 让代码通货膨胀已经是事实。 AI 让代码行数增加了，那么质量有变好吗？很遗憾报告没有提这事，毕竟代码行好统计，代码质量可不好衡量。报告里的数据还是可以看看。工具生态那部分，向量数据库市场目前群雄逐鹿，Weaviate 以 25% 份额领先，但后面跟着六七家都在 10%-25% 之间，还没分出胜负。AI 记忆包里 mem0 占了 59%，遥遥领先。规则文件方面，CLAUDE .md 以 67% 的采用率登顶，说明用 Claude 做编程智能体的开发者确实不少。 SDK 下载量的变化趋势更有意思。OpenAI 还是绝对领先，月下载 1.3 亿次。但 Anthropic 的增速惊人，从 2023 年 4 月到现在增长了 1547 倍，现在稳定在 4300 万。OpenAI 与 Anthropic 的下载比例从 2024 年初的 47:1 缩小到了现在的 4.2:1。Google 的 GenAI SDK 还在 1360 万，落后明显。模型性能对比那部分，测试了 GPT-5.1、GPT-5-Codex、Claude Sonnet 4.5、Claude Opus 4.5 和 Gemini 3 Pro。几个发现值得注意。首 token 响应时间，Anthropic 的两款模型都在 2.5 秒以内，其他三个要两倍以上。别小看这几秒——在交互式编程场景下，等待时间长了你的思路就断了，得重新进入状态。吞吐量方面，OpenAI 的两款模型最快，中位数能到 60-70 tokens/秒。Anthropic 在 17-20 之间，Gemini 只有 4-5。但吞吐量高不代表一切，还得看你的使用场景是不是真需要那么快。成本对比以 GPT-5 Codex 为基准设为 1x，GPT-5.1 也是 1x，Gemini 3 Pro 是 1.4x，Claude Sonnet 4.5 是 2x，Claude Opus 4.5 是 3.3x。Anthropic 的模型明显更贵，但很多用户觉得代码质量更好，愿意为此付费。报告最后介绍了一批最新研究，包括 DeepSeek-V3 的 MoE 架构、长上下文 vs RAG 的取舍、MEM1 的恒定内存智能体框架等等。这部分更像是给专业开发者的阅读清单，不展开了。

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

宝玉

Thu Dec 18 06:16:45

Why are people crashing out on the “Asian female & white male” combo in particular, but not so much at other combos like “Asian male & white female” / “Asian female & white female” / “Asian male & white male” / etc? Genuinely curious…

“The woman scooping Silicon Valley” — BBC・hacker turned builder, blogger & consultant・ex: Threads, Instagram, etc

Jane Manchun Wong

Thu Dec 18 06:16:14

现在，全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。在车上，Grok 不仅能听懂你说什么，还能直接操作车辆系统：查询电池、电量、车况规划路线从 X 上搜索内容自动生成旅行计划（路线 + 停靠点 + 沿途推荐）

Big Bench Audio 智能基准测试：在音频推理基准测试中，Grok 排名第1。智能得分： 95%（领先所有竞争对手）响应速度：平均 time-to-first-audio < 1 秒，比最近的竞争对手快约5倍。在线体验：https://t.co/AbSskmXvhu 详细介绍：https://t.co/yzASWYOgSs

小互

Thu Dec 18 06:15:49

Newest first — browse tweet threads

Explorer

Newest first — browse tweet threads

RT @merinsay: @julesyoo and @JayRughani immediately understood the immense opportunity that lies in building a new operating system for car…

RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮，我通常会先帮一个小忙，可能只花我几分钟，如果对方一直记得，特别感激，那我就愿意继续帮他，因为大部分时候，帮对了人，就是双赢和共赢。

Why are people crashing out on the “Asian female & white male” combo in particular, but not so much at other combos like “Asian male & white female” / “Asian female & white female” / “Asian male & white male” / etc? Genuinely curious…

现在，全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。在车上，Grok 不仅能听懂你说什么，还能直接操作车辆系统：查询电池、电量、车况规划路线从 X 上搜索内容自动生成旅行计划（路线 + 停靠点 + 沿途推荐）

Explorer

Newest first — browse tweet threads

Explorer

Newest first — browse tweet threads

RT @merinsay: @julesyoo and @JayRughani immediately understood the immense opportunity that lies in building a new operating system for car…

RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮， 我通常会先帮一个小忙，可能只花我几分钟， 如果对方一直记得，特别感激， 那我就愿意继续帮他， 因为大部分时候，帮对了人，就是双赢和共赢。

Why are people crashing out on the “Asian female & white male” combo in particular, but not so much at other combos like “Asian male & white female” / “Asian female & white female” / “Asian male & white male” / etc? Genuinely curious…

现在，全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。 在车上，Grok 不仅能听懂你说什么，还能直接操作车辆系统： 查询电池、电量、车况 规划路线 从 X 上搜索内容 自动生成旅行计划（路线 + 停靠点 + 沿途推荐）

RT @Rourou0413: 朋友问我怎么判断一个人是不是值得帮，我通常会先帮一个小忙，可能只花我几分钟，如果对方一直记得，特别感激，那我就愿意继续帮他，因为大部分时候，帮对了人，就是双赢和共赢。

现在，全球数百万辆 Tesla 汽车的语音助手都是 Grok 驱动的。在车上，Grok 不仅能听懂你说什么，还能直接操作车辆系统：查询电池、电量、车况规划路线从 X 上搜索内容自动生成旅行计划（路线 + 停靠点 + 沿途推荐）