Explorer
Composer un thread

Thread Easy

Votre partenaire tout-en-un pour les threads Twitter

© 2025 Thread Easy All Rights Reserved.

Explorer

Newest first — browse tweet threads

Author handle

From date

To date

Blur thumbnails

Keep on to blur preview images; turn off to show them clearly

AlexNet didn't win the NIPS best paper award the year it came out. This one did:
https://t.co/yVQxm4yKb0

AlexNet didn't win the NIPS best paper award the year it came out. This one did: https://t.co/yVQxm4yKb0

Professor of computer science at UW and author of '2040' and 'The Master Algorithm'. Into machine learning, AI, and anything that makes me curious.

Thu Dec 11 01:16:04

Andrej Karpathy 分享「回顾性 Hacker News 讨论自动评分」

Andrej Karpathy 做了一个有趣的 AI 实验：使用 GPT-5.1 Thinking API 对 2015.12 Hacker News（HN）首页上的 930 篇热门文章及其讨论进行“事后分析”。他评估了这些旧帖子的预见性，以识别出最具洞察力和最不准确的观点。项目花了约 3 小时编写代码、1 小时运行，总成本仅 60 美元。

核心内容与方法
· 灵感来源：Karpathy 提到，这个想法受前一天一篇 HN 文章启发，那篇文章让 Gemini 3 模型“幻想到”未来 10 年后的 HN 首页。相比之下，他的项目是“倒推”历史：用当今 AI 回顾过去，训练预测模型。
· 执行过程：AI 模型审阅了 2015 年 12 月的 HN 存档，从“事后视角”打分。重点考察评论的准确性、深度和对未来的洞察，例如科技趋势、AI 发展或社会影响。
· 结果亮点：模型选出了当年 HN 评论中最具预见性的前 10 名用户，包括 pcwalton、tptacek、paulmd、cstross 等。

更广泛的含义
1. 预测训练的价值：这种回顾性分析能帮助人们校准对未来的判断。通过审视旧观点的成败，能更好地“训练”个人预测模型。
2. 未来 AI 的隐忧：他幽默却严肃地提醒，“善待网络内容，因为未来的超级 LLM 会更廉价、更快速地剖析一切”。这呼应了他早前的推文：“Be good, future LLMs are watching”。本质上，互联网数据已成为“免费”的永恒遗产，AI 将无情审计它——这既是工具，也是警示。

Andrej Karpathy 分享「回顾性 Hacker News 讨论自动评分」 Andrej Karpathy 做了一个有趣的 AI 实验：使用 GPT-5.1 Thinking API 对 2015.12 Hacker News（HN）首页上的 930 篇热门文章及其讨论进行“事后分析”。他评估了这些旧帖子的预见性，以识别出最具洞察力和最不准确的观点。项目花了约 3 小时编写代码、1 小时运行，总成本仅 60 美元。核心内容与方法 · 灵感来源：Karpathy 提到，这个想法受前一天一篇 HN 文章启发，那篇文章让 Gemini 3 模型“幻想到”未来 10 年后的 HN 首页。相比之下，他的项目是“倒推”历史：用当今 AI 回顾过去，训练预测模型。 · 执行过程：AI 模型审阅了 2015 年 12 月的 HN 存档，从“事后视角”打分。重点考察评论的准确性、深度和对未来的洞察，例如科技趋势、AI 发展或社会影响。 · 结果亮点：模型选出了当年 HN 评论中最具预见性的前 10 名用户，包括 pcwalton、tptacek、paulmd、cstross 等。更广泛的含义 1. 预测训练的价值：这种回顾性分析能帮助人们校准对未来的判断。通过审视旧观点的成败，能更好地“训练”个人预测模型。 2. 未来 AI 的隐忧：他幽默却严肃地提醒，“善待网络内容，因为未来的超级 LLM 会更廉价、更快速地剖析一切”。这呼应了他早前的推文：“Be good, future LLMs are watching”。本质上，互联网数据已成为“免费”的永恒遗产，AI 将无情审计它——这既是工具，也是警示。

邵猛，中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱：shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

Thu Dec 11 01:14:15

RT @jackfriks: today im adding cute animals to my couples app to get a 5 star review from user who doesn’t like pigs

RT @jackfriks: today im adding cute animals to my couples app to get a 5 star review from user who doesn’t like pigs

curious guy creating things @ https://t.co/HXWladhJaA - up and coming wife guy

Thu Dec 11 01:13:53

my fiancee told me i didnt add a turtle or an elephant like i committed a felony

so i added turtle and elephant and some more pets

my fiancee told me i didnt add a turtle or an elephant like i committed a felony so i added turtle and elephant and some more pets

curious guy creating things @ https://t.co/HXWladhJaA - up and coming wife guy

Thu Dec 11 01:13:18

📢 Cursor 2.2 版本发布：调试模式、计划模式和多智能体协作方向重点发力

🔍 全新“调试模式” (Debug Mode)
这是本次更新的重头戏。以往 AI 编程工具往往只负责“写代码”，而不管“修 Bug”。
· 功能：Cursor 现在可以主动帮助你复现和修复棘手的 Bug。
· 原理：它通过在应用运行时植入日志来追踪问题，从而找到报错的根本原因。
· 适用性：支持多种技术栈、编程语言和模型。
· 意义：这标志着 AI 从单纯的“代码生成者”向“全栈维护者”迈进了一大步，能显著减少开发者排查疑难杂症的时间。

🧠 “计划模式”升级 (Plan Mode Improvements)
“计划模式”用于让 AI 在写代码前先生成通过步骤。本次升级使其更加可视化和灵活。
· 可视化流程图：支持内嵌 Mermaid 图表。Agent 可以自动生成并流式传输流程图或架构图，让你直观地看到 AI 的解题思路。
· 更强的控制力：你现在可以手动选择计划中的某些“待办事项”，并将它们派发给新的 Agent 去执行。这意味着你可以更精细地指挥 AI 分工协作。

⚖️ 多智能体“裁判”机制 (Multi-Agent Judging)
在 Cursor 2.0 推出的“多智能体并行”功能基础上，2.2 版本引入了“裁判”。
· 痛点：以前如果你让多个 Agent 并行写代码，你需要自己去判断哪个结果最好。
· 解决方案：现在，当多个 Agent 完成任务后，Cursor 会自动评估所有结果，并推荐最佳方案。
· 透明度：被选中的方案会附带一条评论，解释为什么它是最好的。这大大降低了用户在多个 AI 生成结果中做选择的决策成本。

📌 聊天置顶 (Pinned Chats)
· 功能：现在可以在 Agent 侧边栏中置顶重要的对话。
· 场景：适用于那些长期进行的任务或包含重要上下文信息的对话，方便随时回溯。

更新日志

📢 Cursor 2.2 版本发布：调试模式、计划模式和多智能体协作方向重点发力 🔍 全新“调试模式” (Debug Mode) 这是本次更新的重头戏。以往 AI 编程工具往往只负责“写代码”，而不管“修 Bug”。 · 功能：Cursor 现在可以主动帮助你复现和修复棘手的 Bug。 · 原理：它通过在应用运行时植入日志来追踪问题，从而找到报错的根本原因。 · 适用性：支持多种技术栈、编程语言和模型。 · 意义：这标志着 AI 从单纯的“代码生成者”向“全栈维护者”迈进了一大步，能显著减少开发者排查疑难杂症的时间。 🧠 “计划模式”升级 (Plan Mode Improvements) “计划模式”用于让 AI 在写代码前先生成通过步骤。本次升级使其更加可视化和灵活。 · 可视化流程图：支持内嵌 Mermaid 图表。Agent 可以自动生成并流式传输流程图或架构图，让你直观地看到 AI 的解题思路。 · 更强的控制力：你现在可以手动选择计划中的某些“待办事项”，并将它们派发给新的 Agent 去执行。这意味着你可以更精细地指挥 AI 分工协作。 ⚖️ 多智能体“裁判”机制 (Multi-Agent Judging) 在 Cursor 2.0 推出的“多智能体并行”功能基础上，2.2 版本引入了“裁判”。 · 痛点：以前如果你让多个 Agent 并行写代码，你需要自己去判断哪个结果最好。 · 解决方案：现在，当多个 Agent 完成任务后，Cursor 会自动评估所有结果，并推荐最佳方案。 · 透明度：被选中的方案会附带一条评论，解释为什么它是最好的。这大大降低了用户在多个 AI 生成结果中做选择的决策成本。 📌 聊天置顶 (Pinned Chats) · 功能：现在可以在 Agent 侧边栏中置顶重要的对话。 · 场景：适用于那些长期进行的任务或包含重要上下文信息的对话，方便随时回溯。更新日志

邵猛，中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱：shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

Thu Dec 11 01:08:26

RT @staticmaker1: "boring" Excel formula creator.

solo founder.

traffic via SEO.

monetization via subscriptions.

generates $26,000 a mo…

RT @staticmaker1: "boring" Excel formula creator. solo founder. traffic via SEO. monetization via subscriptions. generates $26,000 a mo…

Discovering "boring" businesses at https://t.co/VrB2vWopEc. Sharing "boring" business opportunities at https://t.co/1qQOVZrUXW.

Thu Dec 11 01:03:29

Previous
1
1042
1043
1044
5634
Next