LogoThread Easy
  • Explorer
  • Composer un thread
LogoThread Easy

Votre partenaire tout-en-un pour les threads Twitter

© 2025 Thread Easy All Rights Reserved.

Explorer

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

AlexNet didn't win the NIPS best paper award the year it came out. This one did:
https://t.co/yVQxm4yKb0

AlexNet didn't win the NIPS best paper award the year it came out. This one did: https://t.co/yVQxm4yKb0

Professor of computer science at UW and author of '2040' and 'The Master Algorithm'. Into machine learning, AI, and anything that makes me curious.

avatar for Pedro Domingos
Pedro Domingos
Thu Dec 11 01:16:04
Andrej Karpathy 分享「回顾性 Hacker News 讨论自动评分」

Andrej Karpathy 做了一个有趣的 AI 实验:使用 GPT-5.1 Thinking API 对 2015.12 Hacker News(HN)首页上的 930 篇热门文章及其讨论进行“事后分析”。他评估了这些旧帖子的预见性,以识别出最具洞察力和最不准确的观点。项目花了约 3 小时编写代码、1 小时运行,总成本仅 60 美元。

核心内容与方法
· 灵感来源:Karpathy 提到,这个想法受前一天一篇 HN 文章启发,那篇文章让 Gemini 3 模型“幻想到”未来 10 年后的 HN 首页。相比之下,他的项目是“倒推”历史:用当今 AI 回顾过去,训练预测模型。
· 执行过程:AI 模型审阅了 2015 年 12 月的 HN 存档,从“事后视角”打分。重点考察评论的准确性、深度和对未来的洞察,例如科技趋势、AI 发展或社会影响。
· 结果亮点:模型选出了当年 HN 评论中最具预见性的前 10 名用户,包括 pcwalton、tptacek、paulmd、cstross 等。

更广泛的含义
1. 预测训练的价值:这种回顾性分析能帮助人们校准对未来的判断。通过审视旧观点的成败,能更好地“训练”个人预测模型。
2. 未来 AI 的隐忧:他幽默却严肃地提醒,“善待网络内容,因为未来的超级 LLM 会更廉价、更快速地剖析一切”。这呼应了他早前的推文:“Be good, future LLMs are watching”。本质上,互联网数据已成为“免费”的永恒遗产,AI 将无情审计它——这既是工具,也是警示。

Andrej Karpathy 分享「回顾性 Hacker News 讨论自动评分」 Andrej Karpathy 做了一个有趣的 AI 实验:使用 GPT-5.1 Thinking API 对 2015.12 Hacker News(HN)首页上的 930 篇热门文章及其讨论进行“事后分析”。他评估了这些旧帖子的预见性,以识别出最具洞察力和最不准确的观点。项目花了约 3 小时编写代码、1 小时运行,总成本仅 60 美元。 核心内容与方法 · 灵感来源:Karpathy 提到,这个想法受前一天一篇 HN 文章启发,那篇文章让 Gemini 3 模型“幻想到”未来 10 年后的 HN 首页。相比之下,他的项目是“倒推”历史:用当今 AI 回顾过去,训练预测模型。 · 执行过程:AI 模型审阅了 2015 年 12 月的 HN 存档,从“事后视角”打分。重点考察评论的准确性、深度和对未来的洞察,例如科技趋势、AI 发展或社会影响。 · 结果亮点:模型选出了当年 HN 评论中最具预见性的前 10 名用户,包括 pcwalton、tptacek、paulmd、cstross 等。 更广泛的含义 1. 预测训练的价值:这种回顾性分析能帮助人们校准对未来的判断。通过审视旧观点的成败,能更好地“训练”个人预测模型。 2. 未来 AI 的隐忧:他幽默却严肃地提醒,“善待网络内容,因为未来的超级 LLM 会更廉价、更快速地剖析一切”。这呼应了他早前的推文:“Be good, future LLMs are watching”。本质上,互联网数据已成为“免费”的永恒遗产,AI 将无情审计它——这既是工具,也是警示。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Thu Dec 11 01:14:15
RT @jackfriks: today im adding cute animals to my couples app to get a 5 star review from user who doesn’t like pigs

RT @jackfriks: today im adding cute animals to my couples app to get a 5 star review from user who doesn’t like pigs

curious guy creating things @ https://t.co/HXWladhJaA - up and coming wife guy

avatar for jack friks
jack friks
Thu Dec 11 01:13:53
my fiancee told me i didnt add a turtle or an elephant like i committed a felony

so i added turtle and elephant and some more pets

my fiancee told me i didnt add a turtle or an elephant like i committed a felony so i added turtle and elephant and some more pets

curious guy creating things @ https://t.co/HXWladhJaA - up and coming wife guy

avatar for jack friks
jack friks
Thu Dec 11 01:13:18
📢 Cursor 2.2 版本发布:调试模式、计划模式 和 多智能体协作方向重点发力

🔍 全新“调试模式” (Debug Mode)
这是本次更新的重头戏。以往 AI 编程工具往往只负责“写代码”,而不管“修 Bug”。
· 功能:Cursor 现在可以主动帮助你复现和修复棘手的 Bug。
· 原理:它通过在应用运行时植入日志来追踪问题,从而找到报错的根本原因。
· 适用性:支持多种技术栈、编程语言和模型。
· 意义:这标志着 AI 从单纯的“代码生成者”向“全栈维护者”迈进了一大步,能显著减少开发者排查疑难杂症的时间。

🧠 “计划模式”升级 (Plan Mode Improvements)
“计划模式”用于让 AI 在写代码前先生成通过步骤。本次升级使其更加可视化和灵活。
· 可视化流程图:支持内嵌 Mermaid 图表。Agent 可以自动生成并流式传输流程图或架构图,让你直观地看到 AI 的解题思路。
· 更强的控制力:你现在可以手动选择计划中的某些“待办事项”,并将它们派发给新的 Agent 去执行。这意味着你可以更精细地指挥 AI 分工协作。

⚖️ 多智能体“裁判”机制 (Multi-Agent Judging)
在 Cursor 2.0 推出的“多智能体并行”功能基础上,2.2 版本引入了“裁判”。
· 痛点:以前如果你让多个 Agent 并行写代码,你需要自己去判断哪个结果最好。
· 解决方案:现在,当多个 Agent 完成任务后,Cursor 会自动评估所有结果,并推荐最佳方案。
· 透明度:被选中的方案会附带一条评论,解释为什么它是最好的。这大大降低了用户在多个 AI 生成结果中做选择的决策成本。

📌 聊天置顶 (Pinned Chats)
· 功能:现在可以在 Agent 侧边栏中置顶重要的对话。
· 场景:适用于那些长期进行的任务或包含重要上下文信息的对话,方便随时回溯。

更新日志

📢 Cursor 2.2 版本发布:调试模式、计划模式 和 多智能体协作方向重点发力 🔍 全新“调试模式” (Debug Mode) 这是本次更新的重头戏。以往 AI 编程工具往往只负责“写代码”,而不管“修 Bug”。 · 功能:Cursor 现在可以主动帮助你复现和修复棘手的 Bug。 · 原理:它通过在应用运行时植入日志来追踪问题,从而找到报错的根本原因。 · 适用性:支持多种技术栈、编程语言和模型。 · 意义:这标志着 AI 从单纯的“代码生成者”向“全栈维护者”迈进了一大步,能显著减少开发者排查疑难杂症的时间。 🧠 “计划模式”升级 (Plan Mode Improvements) “计划模式”用于让 AI 在写代码前先生成通过步骤。本次升级使其更加可视化和灵活。 · 可视化流程图:支持内嵌 Mermaid 图表。Agent 可以自动生成并流式传输流程图或架构图,让你直观地看到 AI 的解题思路。 · 更强的控制力:你现在可以手动选择计划中的某些“待办事项”,并将它们派发给新的 Agent 去执行。这意味着你可以更精细地指挥 AI 分工协作。 ⚖️ 多智能体“裁判”机制 (Multi-Agent Judging) 在 Cursor 2.0 推出的“多智能体并行”功能基础上,2.2 版本引入了“裁判”。 · 痛点:以前如果你让多个 Agent 并行写代码,你需要自己去判断哪个结果最好。 · 解决方案:现在,当多个 Agent 完成任务后,Cursor 会自动评估所有结果,并推荐最佳方案。 · 透明度:被选中的方案会附带一条评论,解释为什么它是最好的。这大大降低了用户在多个 AI 生成结果中做选择的决策成本。 📌 聊天置顶 (Pinned Chats) · 功能:现在可以在 Agent 侧边栏中置顶重要的对话。 · 场景:适用于那些长期进行的任务或包含重要上下文信息的对话,方便随时回溯。 更新日志

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Thu Dec 11 01:08:26
RT @staticmaker1: "boring" Excel formula creator.

solo founder.

traffic via SEO.

monetization via subscriptions.

generates $26,000 a mo…

RT @staticmaker1: "boring" Excel formula creator. solo founder. traffic via SEO. monetization via subscriptions. generates $26,000 a mo…

Discovering "boring" businesses at https://t.co/VrB2vWopEc. Sharing "boring" business opportunities at https://t.co/1qQOVZrUXW.

avatar for staticmaker
staticmaker
Thu Dec 11 01:03:29
  • Previous
  • 1
  • More pages
  • 1042
  • 1043
  • 1044
  • More pages
  • 5634
  • Next