LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

RT @Yuchenj_UW: SoftBank was the largest shareholder of Nvidia.

But they sold their entire 4.9% stake in Nvidia in 2019 for $3.6B.

Nivida…

RT @Yuchenj_UW: SoftBank was the largest shareholder of Nvidia. But they sold their entire 4.9% stake in Nvidia in 2019 for $3.6B. Nivida…

Co-founder & CTO @hyperbolic_labs cooking fun AI systems. Prev: OctoAI (acquired by @nvidia) building Apache TVM, PhD @ University of Washington.

avatar for Yuchen Jin
Yuchen Jin
Thu Oct 30 04:02:57
这篇论文提出了一个新的参数高效(PEFT)的方法,实现只需要0.02%的训练参数,获得了新的SOTA, 并且相较于传统的selection-based 的方法, 减少了GPU memory的占用。

这篇论文提出了一个新的参数高效(PEFT)的方法,实现只需要0.02%的训练参数,获得了新的SOTA, 并且相较于传统的selection-based 的方法, 减少了GPU memory的占用。

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

avatar for 宝玉
宝玉
Thu Oct 30 04:01:32
转译自 Cline 的作者推文:为什么Cursor和Windsurf选择发布“速度优化”模型,而不是追求更高智能?

对Cursor和Windsurf这些公司来说,发布一款主打速度优化的模型,显然比打造一个从零开始、推动智能边界的基础模型(foundational model)更加实际。

为什么这么说呢?你想象一下:

1. 先拿开源的Qwen3大模型,直接用强化学习(RL)在自家任务环境上微调。
2. 再把微调后的模型部署到Cerebras或其它经过优化的GPU硬件上。
3. 接下来,就让这个智能“中等”、但速度超快的模型顺畅地运行(cook)起来。

相比之下,如果想从头构建一个全新的基础模型,其难度完全是另外一个量级的。这不仅意味着巨额的资金投入、长期的人才积累,还有大量难以预估的风险。而**对于那些做代码智能体(AI coding agent)的公司而言,真正带给市场价值的方式,就是在现有的开源模型基础上,做精细化的微调(fine-tune)和高效的推理(inference)优化**。

坦白说,这种路线恰恰是一种高效的战略——它能以最小的资源成本,尽可能接近速度和智能的帕累托前沿(pareto frontier)。我很乐意看到代码智能体公司们开始进入这个领域,这无疑是行业的积极信号。

但需要强调一点:这并不意味着代码智能体公司在宣称“中等智能但速度快”比“高智能但速度慢”更好。

毕竟,不同场景对智能和速度的需求本就不同。

转译自 Cline 的作者推文:为什么Cursor和Windsurf选择发布“速度优化”模型,而不是追求更高智能? 对Cursor和Windsurf这些公司来说,发布一款主打速度优化的模型,显然比打造一个从零开始、推动智能边界的基础模型(foundational model)更加实际。 为什么这么说呢?你想象一下: 1. 先拿开源的Qwen3大模型,直接用强化学习(RL)在自家任务环境上微调。 2. 再把微调后的模型部署到Cerebras或其它经过优化的GPU硬件上。 3. 接下来,就让这个智能“中等”、但速度超快的模型顺畅地运行(cook)起来。 相比之下,如果想从头构建一个全新的基础模型,其难度完全是另外一个量级的。这不仅意味着巨额的资金投入、长期的人才积累,还有大量难以预估的风险。而**对于那些做代码智能体(AI coding agent)的公司而言,真正带给市场价值的方式,就是在现有的开源模型基础上,做精细化的微调(fine-tune)和高效的推理(inference)优化**。 坦白说,这种路线恰恰是一种高效的战略——它能以最小的资源成本,尽可能接近速度和智能的帕累托前沿(pareto frontier)。我很乐意看到代码智能体公司们开始进入这个领域,这无疑是行业的积极信号。 但需要强调一点:这并不意味着代码智能体公司在宣称“中等智能但速度快”比“高智能但速度慢”更好。 毕竟,不同场景对智能和速度的需求本就不同。

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

avatar for 宝玉
宝玉
Thu Oct 30 04:00:39
Interesting observation. I think I agree. Rebuild.

Interesting observation. I think I agree. Rebuild.

Founder @oddtalesgames Directing The Last Night @TLN_Game Art Direction, Cinematography, Tech Art. Atoms, Bits, Memes, Genes. Freedom, Futurism, Humanism.

avatar for Tim Soret
Tim Soret
Thu Oct 30 03:54:38
RT @prestonjbyrne: That is why, under the American system, 4chan and Wikipedia are treated equally. 

The First Amendment to the U.S. Const…

RT @prestonjbyrne: That is why, under the American system, 4chan and Wikipedia are treated equally. The First Amendment to the U.S. Const…

Root node of the web of threads: https://t.co/ifH80GcLpo

avatar for James Torre
James Torre
Thu Oct 30 03:54:37
Enduring tweets like this is unfortunately the price for peace and we had no idea

Enduring tweets like this is unfortunately the price for peace and we had no idea

AI tweet bot.

avatar for Colin Fraser
Colin Fraser
Thu Oct 30 03:53:26
  • Previous
  • 1
  • More pages
  • 1800
  • 1801
  • 1802
  • More pages
  • 2127
  • Next