LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

At the 4:00 mark you can see a UI glitch where links crossover each other. 

That bug has been in @Bento for years.

I just solved it with @cursor_ai debug.

At the 4:00 mark you can see a UI glitch where links crossover each other. That bug has been in @Bento for years. I just solved it with @cursor_ai debug.

Marketer, self-taught developer, and founder of @Bento and https://t.co/lcsIohchEv. Designing a quiet family life in 福岡, Japan. DMs open if you need email help 🌿

avatar for ˗ˏˋ Jesse Hanley ˎˊ˗
˗ˏˋ Jesse Hanley ˎˊ˗
Fri Dec 12 01:04:22
RT @indie_maker_fox: Nextjs 16 确实肉眼可见的快了!推荐升级!

如果是部署在cloudflare worker上,据说OpenNextjs下周也将支持Nextjs 16,这样的话,部署在cloudflare worker上也没有问题了。

快了快…

RT @indie_maker_fox: Nextjs 16 确实肉眼可见的快了!推荐升级! 如果是部署在cloudflare worker上,据说OpenNextjs下周也将支持Nextjs 16,这样的话,部署在cloudflare worker上也没有问题了。 快了快…

🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF

avatar for Fox@MkSaaS.com
Fox@MkSaaS.com
Fri Dec 12 01:02:14
RT @davidsacks47: Today President Trump signed an Executive Order on “Ensuring a National Policy Framework for Artificial Intelligence.” Th…

RT @davidsacks47: Today President Trump signed an Executive Order on “Ensuring a National Policy Framework for Artificial Intelligence.” Th…

work on AI at the @whitehouse. pro wrestling fan. official: @skrishnan47

avatar for Sriram Krishnan
Sriram Krishnan
Fri Dec 12 01:01:54
RT @indie_maker_fox: 4️⃣ Affonso:$299 买了1年会员,用于MkSaaS的分销

https://t.co/cCLk9tFZgl

5️⃣ SaaSBoilerplates:$107 买了3个月首页的广告位

6️⃣ Trancy:$30 沉浸…

RT @indie_maker_fox: 4️⃣ Affonso:$299 买了1年会员,用于MkSaaS的分销 https://t.co/cCLk9tFZgl 5️⃣ SaaSBoilerplates:$107 买了3个月首页的广告位 6️⃣ Trancy:$30 沉浸…

🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF

avatar for Fox@MkSaaS.com
Fox@MkSaaS.com
Fri Dec 12 01:01:17
OpenAI「Code Red」?GPT-5.2 正式发布,正面迎战  Gemini 3 Pro 和 Claude Opus 4.5

如果说 GPT-5.1 是迈向新架构的尝试,那么 GPT-5.2 则是 OpenAI 为夺回“王座”而打磨出的成熟完全体。它不再仅追求通用的聊天能力,而是极度聚焦于 “职业级知识工作 ”和 “长程智能体” 的可靠性。

核心定位:从“聊天机器人”到“专家级同事”
GPT-5.2 最显著的变化是推出了三个针对性极强的版本,试图覆盖所有工作场景:
· GPT-5.2 Instant: 极速响应,负责处理日常信息检索和轻量级任务,继承了 5.1 的高情商对话风格。
· GPT-5.2 Thinking: 这是本次更新的核心。 它引入了更深层的逻辑推理链,专门解决复杂的电子表格处理、金融建模和多步决策问题。
· GPT-5.2 Pro: 算力最强、成本最高的版本,用于处理那些“值得等待”的高难度科研或决策问题。

关键能力突破
· 逻辑推理的天花板: 在 AIME 2025 测试中,GPT-5.2 取得了 100% 的完美分数(GPT-5.1 为 94%),且无需借助外部工具。这标志着大模型在数理逻辑上已经能够零失误地解决人类竞赛级难题。
· 近乎完美的超长上下文: 在 256k token 的超长文本测试中,它实现了近乎 100% 的“大海捞针”准确率。这意味着它能真正读懂几百页的财报或技术文档,而不仅仅是概括大意。
· 职业替代率飙升: OpenAI 引入了一个新指标 GDPval。GPT-5.2 在 70.9% 的任务中表现优于或持平人类专家,而此前的 GPT-5 仅为 38.8%。

三巨头横向对比:2025 冬季战局
目前的 AI 领域呈现出清晰的“三足鼎立”态势,三家模型各有所长,不再是单一模型全面碾压的时代。

VS. Gemini 3 Pro
· 多模态:Gemini 3 Pro 依然是王者。Google 凭借 DeepMind 的深厚积累,在视觉理解上筑起了高墙。Gemini 3 Pro 在 MMMU-Pro 上得分为 81.0%。特别是在视频理解(如 YouCook2 测试)上,Gemini 3 Pro 以 222.7 的高分碾压了 GPT 系列,如果你需要处理视频流或复杂的空间推理,Gemini 3 Pro 仍是首选。
· 综合体验: Gemini 3 Pro 的优势在于“原生多模态”带来的流畅感,而 GPT-5.2 则是通过极致的“文本逻辑推理”来弥补感知上的差距,试图用更聪明的大脑来处理信息。

VS. Claude Opus 4.5
· 代码与智能体:战况胶着。Claude Opus 4.5 此前以“智能体可靠性”著称,特别是在 SWE-bench 测试中一度封神,被程序员誉为最好用的结对编程伙伴。

· GPT-5.2 的反击: 此次 GPT-5.2 重点优化的就是“工具调用”和“多步执行”能力,明确对标 Claude 的长板。GPT-5.2 宣称在处理多步骤、跨文档的复杂项目时,错误率降低了 30%。对于开发者而言,Claude 的“人性化”和 GPT-5.2 的“严谨逻辑”将成为两种不同的选择风格。

OpenAI 官方介绍

OpenAI「Code Red」?GPT-5.2 正式发布,正面迎战 Gemini 3 Pro 和 Claude Opus 4.5 如果说 GPT-5.1 是迈向新架构的尝试,那么 GPT-5.2 则是 OpenAI 为夺回“王座”而打磨出的成熟完全体。它不再仅追求通用的聊天能力,而是极度聚焦于 “职业级知识工作 ”和 “长程智能体” 的可靠性。 核心定位:从“聊天机器人”到“专家级同事” GPT-5.2 最显著的变化是推出了三个针对性极强的版本,试图覆盖所有工作场景: · GPT-5.2 Instant: 极速响应,负责处理日常信息检索和轻量级任务,继承了 5.1 的高情商对话风格。 · GPT-5.2 Thinking: 这是本次更新的核心。 它引入了更深层的逻辑推理链,专门解决复杂的电子表格处理、金融建模和多步决策问题。 · GPT-5.2 Pro: 算力最强、成本最高的版本,用于处理那些“值得等待”的高难度科研或决策问题。 关键能力突破 · 逻辑推理的天花板: 在 AIME 2025 测试中,GPT-5.2 取得了 100% 的完美分数(GPT-5.1 为 94%),且无需借助外部工具。这标志着大模型在数理逻辑上已经能够零失误地解决人类竞赛级难题。 · 近乎完美的超长上下文: 在 256k token 的超长文本测试中,它实现了近乎 100% 的“大海捞针”准确率。这意味着它能真正读懂几百页的财报或技术文档,而不仅仅是概括大意。 · 职业替代率飙升: OpenAI 引入了一个新指标 GDPval。GPT-5.2 在 70.9% 的任务中表现优于或持平人类专家,而此前的 GPT-5 仅为 38.8%。 三巨头横向对比:2025 冬季战局 目前的 AI 领域呈现出清晰的“三足鼎立”态势,三家模型各有所长,不再是单一模型全面碾压的时代。 VS. Gemini 3 Pro · 多模态:Gemini 3 Pro 依然是王者。Google 凭借 DeepMind 的深厚积累,在视觉理解上筑起了高墙。Gemini 3 Pro 在 MMMU-Pro 上得分为 81.0%。特别是在视频理解(如 YouCook2 测试)上,Gemini 3 Pro 以 222.7 的高分碾压了 GPT 系列,如果你需要处理视频流或复杂的空间推理,Gemini 3 Pro 仍是首选。 · 综合体验: Gemini 3 Pro 的优势在于“原生多模态”带来的流畅感,而 GPT-5.2 则是通过极致的“文本逻辑推理”来弥补感知上的差距,试图用更聪明的大脑来处理信息。 VS. Claude Opus 4.5 · 代码与智能体:战况胶着。Claude Opus 4.5 此前以“智能体可靠性”著称,特别是在 SWE-bench 测试中一度封神,被程序员誉为最好用的结对编程伙伴。 · GPT-5.2 的反击: 此次 GPT-5.2 重点优化的就是“工具调用”和“多步执行”能力,明确对标 Claude 的长板。GPT-5.2 宣称在处理多步骤、跨文档的复杂项目时,错误率降低了 30%。对于开发者而言,Claude 的“人性化”和 GPT-5.2 的“严谨逻辑”将成为两种不同的选择风格。 OpenAI 官方介绍

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Fri Dec 12 01:01:10
RT @indie_maker_fox: 🎉 这个小鼹鼠确实猛啊

简单操作下,帮我优化了快100G的存储空间,感谢作者

https://t.co/wpHwO6eYtc

像鼹鼠一样深入挖掘来优化你的 Mac,这个monitor也好看 https://t.co/BNY4rWE…

RT @indie_maker_fox: 🎉 这个小鼹鼠确实猛啊 简单操作下,帮我优化了快100G的存储空间,感谢作者 https://t.co/wpHwO6eYtc 像鼹鼠一样深入挖掘来优化你的 Mac,这个monitor也好看 https://t.co/BNY4rWE…

🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF

avatar for Fox@MkSaaS.com
Fox@MkSaaS.com
Fri Dec 12 01:00:46
  • Previous
  • 1
  • More pages
  • 944
  • 945
  • 946
  • More pages
  • 5634
  • Next