LogoThread Easy
  • 探索
  • 撰写 Thread
LogoThread Easy

您的一体化 Twitter 线程助手

© 2026 Thread Easy All Rights Reserved.

探索

最新在前,按卡片方式浏览线程

开启时会模糊预览图,关闭后正常显示

RT @deanwball: Very excited to see this AI for Science Executive Order—the Genesis Mission. The Administration has appropriately ambitious…

RT @deanwball: Very excited to see this AI for Science Executive Order—the Genesis Mission. The Administration has appropriately ambitious…

https://t.co/N3tfDNkGx4 | founder @trychroma

avatar for anton 🇺🇸
anton 🇺🇸
Tue Nov 25 00:51:21
三年前,我觉得自己是个理性的人。

我做决定会列pros and cons,我吵架会摆事实讲道理,我从不冲动消费。

直到有一天,我发现一件事:

我列的那些pros and cons,其实是我已经做完决定之后,找的理由。

我吵架时摆的那些事实,都是对我有利的那部分,不利的我自动忽略了。

我以为我不冲动消费,但我的购物车里全是"限时优惠"和"最后一天"。

我以为我在用理性做决定。
实际上,是情绪做了决定,理性在后面擦屁股。

心理学把这叫"认知偏误"。

我把它叫:终于承认自己是个普通人。

不是什么都能想明白的普通人。

会被广告骗、会被情绪带着走、会在事后诸葛亮的普通人。

承认这一点,比假装自己很理性,要诚实得多。

也轻松得多。

---
提示词生成的抖音脚本,介绍心理学的“认知偏误”概念。

三年前,我觉得自己是个理性的人。 我做决定会列pros and cons,我吵架会摆事实讲道理,我从不冲动消费。 直到有一天,我发现一件事: 我列的那些pros and cons,其实是我已经做完决定之后,找的理由。 我吵架时摆的那些事实,都是对我有利的那部分,不利的我自动忽略了。 我以为我不冲动消费,但我的购物车里全是"限时优惠"和"最后一天"。 我以为我在用理性做决定。 实际上,是情绪做了决定,理性在后面擦屁股。 心理学把这叫"认知偏误"。 我把它叫:终于承认自己是个普通人。 不是什么都能想明白的普通人。 会被广告骗、会被情绪带着走、会在事后诸葛亮的普通人。 承认这一点,比假装自己很理性,要诚实得多。 也轻松得多。 --- 提示词生成的抖音脚本,介绍心理学的“认知偏误”概念。

喜欢摇滚乐、爱钓鱼的PM 网站:https://t.co/vnUpLt752o

avatar for 向阳乔木
向阳乔木
Tue Nov 25 00:50:21
Tested ChatGPT's new Shopping Research feature and I'm pretty impressed. 

The UI is adaptive to what you're searching for - it asked me different questions and even organized the results differently when I was looking for "Christmas gift for a 13 year old girl" vs. "best white sneakers for work". 

It also asks you to rate products while conducting the search to better refine options (with links and reviews provided) - this makes the wait time more tolerable. And IMO, the results are quite good, with detailed justifications for each product. 

This is a big step up from the other products we've seen in this space (ex. Perplexity Shopping) - I'm curious if they double down on building out UI here...

Tested ChatGPT's new Shopping Research feature and I'm pretty impressed. The UI is adaptive to what you're searching for - it asked me different questions and even organized the results differently when I was looking for "Christmas gift for a 13 year old girl" vs. "best white sneakers for work". It also asks you to rate products while conducting the search to better refine options (with links and reviews provided) - this makes the wait time more tolerable. And IMO, the results are quite good, with detailed justifications for each product. This is a big step up from the other products we've seen in this space (ex. Perplexity Shopping) - I'm curious if they double down on building out UI here...

Partner @a16z and twin to @venturetwins | Investor in @gammaapp, @happyrobot_ai, @krea_ai, @tomaauto, @partiful, Salient, @scribenoteinc & more

avatar for Olivia Moore
Olivia Moore
Tue Nov 25 00:47:09
RT @arvidkahl: Making best-in-class image gen LLM: ✅

Cutting-edge text LLM, fast and cheap: ✅

Logging into Google Docs with the account y…

RT @arvidkahl: Making best-in-class image gen LLM: ✅ Cutting-edge text LLM, fast and cheap: ✅ Logging into Google Docs with the account y…

Building https://t.co/od97B0HVrk and https://t.co/666FnyVVE0 in Public. Raising all the boats with kindness. 🎙️ https://t.co/6w69DZmi8H · ✍️ https://t.co/lpnor5rsTW

avatar for Arvid Kahl
Arvid Kahl
Tue Nov 25 00:42:16
Yume Router is already finding so many great yield routes that are not obvious.

65% APY on SOL
23% APY on USDC

Excited to give yall the best routes

Yume Router is already finding so many great yield routes that are not obvious. 65% APY on SOL 23% APY on USDC Excited to give yall the best routes

building @YumeBank - the best yield aggregator / prev @magiceden @snapchat @square / built @bruh_bears @web3zer0 / react native OSS

avatar for json | yume 🌥️
json | yume 🌥️
Tue Nov 25 00:42:05
Claude Opus 4.5 发布:最强的编码、智能体和计算机使用模型,Token 用量大降,价格是 Opus 4.1 的 1/3,SWE-bench Verified 得分首超 80 分

性能表现
· 编码能力突破:在 SWE-bench Verified 测试中达到 80.9% 的成绩,超越了 Google Gemini 3 Pro(76.2%)和 OpenAI GPT-5.1-Codex-Max(77.9%)。更引人注目的是,在 Anthropic 内部的性能工程测试中,Opus 4.5 的得分超过了所有人类应聘者。

· 智能体能力:在计算机使用测试 OSWorld 中达到 66.3% 的成绩,展现出强大的长期目标导向行为。内部测试人员反馈,Opus 4.5 能够处理 Sonnet 4.5 几周前还无法完成的任务,面对复杂的多系统 bug 时能够自主找到解决方案。

· 效率提升:这是一个重大改进。在处理长期编码任务时,Opus 4.5 使用的 token 数量减少了高达 65%,同时保持或提高了输出质量。这意味着更低的成本和更快的响应速度。

价格革命
定价为每百万输入 token 5 美元,每百万输出 token 25 美元,相比前代 Opus 4.1 的 15/75 美元,价格下降了 2/3。这使得 Opus 级别的能力首次变得可负担,可以成为日常使用的主力模型。

产品更新
多平台可用:Opus 4.5 现已在 Claude 应用、API 以及 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Azure 等三大云平台上线。开发者可以使用模型标识符 claude-opus-4-5-20251101 调用。

技术创新
· 混合推理:Opus 4.5 支持即时响应和扩展思考两种模式,API 用户可以通过"努力参数"(effort parameter)精细控制模型在响应上投入的计算量,在性能、延迟和成本之间取得平衡。

· 记忆改进:在长上下文操作的记忆管理方面有显著改进,特别适合智能体场景——Opus 可以作为主智能体指挥一组 Haiku 驱动的子智能体。

· 安全性增强:模型具有更强的抗提示注入攻击能力,在错位评估中表现出更低的问题行为率,是 Anthropic 迄今为止最安全的版本。

市场定位
Opus 4.5 主要面向专业软件工程师、金融分析师、咨询顾问、会计师等知识工作者,以及需要处理复杂企业任务和重度智能体工作流的场景。这是一款高端模型,适用于以往模型无法解决且性能至关重要的场景。

行业影响
这次发布正值 AI 行业竞争白热化之际。Google 的 Gemini 3 刚刚发布一周,已经引起市场震动,连 Salesforce CEO 都表示要从 ChatGPT 转向 Gemini。Opus 4.5 的推出,展现了 Anthropic 在这场竞赛中保持领先地位的决心和实力。

Claude Opus 4.5 发布:最强的编码、智能体和计算机使用模型,Token 用量大降,价格是 Opus 4.1 的 1/3,SWE-bench Verified 得分首超 80 分 性能表现 · 编码能力突破:在 SWE-bench Verified 测试中达到 80.9% 的成绩,超越了 Google Gemini 3 Pro(76.2%)和 OpenAI GPT-5.1-Codex-Max(77.9%)。更引人注目的是,在 Anthropic 内部的性能工程测试中,Opus 4.5 的得分超过了所有人类应聘者。 · 智能体能力:在计算机使用测试 OSWorld 中达到 66.3% 的成绩,展现出强大的长期目标导向行为。内部测试人员反馈,Opus 4.5 能够处理 Sonnet 4.5 几周前还无法完成的任务,面对复杂的多系统 bug 时能够自主找到解决方案。 · 效率提升:这是一个重大改进。在处理长期编码任务时,Opus 4.5 使用的 token 数量减少了高达 65%,同时保持或提高了输出质量。这意味着更低的成本和更快的响应速度。 价格革命 定价为每百万输入 token 5 美元,每百万输出 token 25 美元,相比前代 Opus 4.1 的 15/75 美元,价格下降了 2/3。这使得 Opus 级别的能力首次变得可负担,可以成为日常使用的主力模型。 产品更新 多平台可用:Opus 4.5 现已在 Claude 应用、API 以及 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Azure 等三大云平台上线。开发者可以使用模型标识符 claude-opus-4-5-20251101 调用。 技术创新 · 混合推理:Opus 4.5 支持即时响应和扩展思考两种模式,API 用户可以通过"努力参数"(effort parameter)精细控制模型在响应上投入的计算量,在性能、延迟和成本之间取得平衡。 · 记忆改进:在长上下文操作的记忆管理方面有显著改进,特别适合智能体场景——Opus 可以作为主智能体指挥一组 Haiku 驱动的子智能体。 · 安全性增强:模型具有更强的抗提示注入攻击能力,在错位评估中表现出更低的问题行为率,是 Anthropic 迄今为止最安全的版本。 市场定位 Opus 4.5 主要面向专业软件工程师、金融分析师、咨询顾问、会计师等知识工作者,以及需要处理复杂企业任务和重度智能体工作流的场景。这是一款高端模型,适用于以往模型无法解决且性能至关重要的场景。 行业影响 这次发布正值 AI 行业竞争白热化之际。Google 的 Gemini 3 刚刚发布一周,已经引起市场震动,连 Salesforce CEO 都表示要从 ChatGPT 转向 Gemini。Opus 4.5 的推出,展现了 Anthropic 在这场竞赛中保持领先地位的决心和实力。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Tue Nov 25 00:38:11
  • Previous
  • 1
  • More pages
  • 2451
  • 2452
  • 2453
  • More pages
  • 5635
  • Next