LogoThread Easy
  • 探索
  • 線程創作
LogoThread Easy

Twitter 線程的一站式夥伴

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

有个过于离谱的细节,Neon 对新创建的项目默认 1-8 CU,而计费公式是:账单 = CU * 时间。也就是说,对于测试项目或者刚启动的项目,1-8 完全是在浪费钱。

我做了几个优化测试,再跑一个月看看:
- 把不重要的数据库最大 CU 调到 0.25,用不量不大的调到0.25-0.5
- 所有数据库都开启Scale to zero
- 删除所有数据库的 development 分支(小项目直接用product 分支)
这几个成本优化方法在 Neon 文档里也找到了,所以肯定是靠谱的,你们也可以试试。

有个过于离谱的细节,Neon 对新创建的项目默认 1-8 CU,而计费公式是:账单 = CU * 时间。也就是说,对于测试项目或者刚启动的项目,1-8 完全是在浪费钱。 我做了几个优化测试,再跑一个月看看: - 把不重要的数据库最大 CU 调到 0.25,用不量不大的调到0.25-0.5 - 所有数据库都开启Scale to zero - 删除所有数据库的 development 分支(小项目直接用product 分支) 这几个成本优化方法在 Neon 文档里也找到了,所以肯定是靠谱的,你们也可以试试。

⛵️全栈工程师,出海开发者,Next.js 手艺人 | Next.js SaaS 模板:https://t.co/YzCDmGttme | Nextjs 中文文档:https://t.co/Ek37EFh3tI | 开源:https://t.co/vMeadXy9OD

avatar for weijunext - nexty.dev
weijunext - nexty.dev
Tue Dec 02 04:39:13
RT @JitendraMalikCV: (1/5) Open Publication and the Prisoners dilemma.
The prisoner’s dilemma game can offer us much insight into the publi…

RT @JitendraMalikCV: (1/5) Open Publication and the Prisoners dilemma. The prisoner’s dilemma game can offer us much insight into the publi…

Professor at NYU. Chief AI Scientist at Meta. Researcher in AI, Machine Learning, Robotics, etc. ACM Turing Award Laureate.

avatar for Yann LeCun
Yann LeCun
Tue Dec 02 04:37:39
Deepseek 3.2带来了很多不一样的变化
一方面速度有明显提升 另外成本又显著下降
现在大家更习惯缝合
缝合不同的SOTA

比如模型价格deepseek是SOTA
agent sdk的话Claude是SOTA
一通缝合  每个场景都用最好的东西

Deepseek 3.2带来了很多不一样的变化 一方面速度有明显提升 另外成本又显著下降 现在大家更习惯缝合 缝合不同的SOTA 比如模型价格deepseek是SOTA agent sdk的话Claude是SOTA 一通缝合 每个场景都用最好的东西

Believing is seeing

avatar for Yangyi
Yangyi
Tue Dec 02 04:31:45
The @togethercompute serverless inference platform is now 2x faster for leading OSS models — through a set of technologies from 5D parallelism, disaggregated serving, speculative decoding, fused fp4 kernels and more.

https://t.co/jG1omhYQYk

The @togethercompute serverless inference platform is now 2x faster for leading OSS models — through a set of technologies from 5D parallelism, disaggregated serving, speculative decoding, fused fp4 kernels and more. https://t.co/jG1omhYQYk

Co-founder, CEO @togethercompute

avatar for Vipul Ved Prakash
Vipul Ved Prakash
Tue Dec 02 04:28:44
看了一下Deepseek最新分享的DSA稀疏注意力的优化策略

个人理解如下:
Deepseek的优化简单来讲做了两大部分,第一部分是对之前注意力机制的KV矩阵进行压缩,当需要时再解压,这样减少了内存占用

第二部分是引入闪电索引器,计算注意力前先计算粗略的索引分数,然后挑分数最高的那部分token进行精确注意力计算,把QK做8bit量化,但由于精度会损失,所以在此之前又增加了哈达玛变换,使数值更均匀分布,以便消除异常值,完成计算优化

看了一下Deepseek最新分享的DSA稀疏注意力的优化策略 个人理解如下: Deepseek的优化简单来讲做了两大部分,第一部分是对之前注意力机制的KV矩阵进行压缩,当需要时再解压,这样减少了内存占用 第二部分是引入闪电索引器,计算注意力前先计算粗略的索引分数,然后挑分数最高的那部分token进行精确注意力计算,把QK做8bit量化,但由于精度会损失,所以在此之前又增加了哈达玛变换,使数值更均匀分布,以便消除异常值,完成计算优化

原推文:

avatar for Yangyi
Yangyi
Tue Dec 02 04:14:36
两年前注册的美国公司,当时申请了 Google Cloud Platform 的 Startup Credit,批下来 $2000,有效期两年。用到今天几乎刚好把 Credit 用完了(多支付了 $8.94),之前每个月都是象征性的扣 $0.01 的。接下去要考虑降本增效了…

两年前注册的美国公司,当时申请了 Google Cloud Platform 的 Startup Credit,批下来 $2000,有效期两年。用到今天几乎刚好把 Credit 用完了(多支付了 $8.94),之前每个月都是象征性的扣 $0.01 的。接下去要考虑降本增效了…

生活在杭州良渚的开发者。最近在做 https://t.co/Fu0JLSMTGF

avatar for 图拉鼎
图拉鼎
Tue Dec 02 04:07:30
  • Previous
  • 1
  • More pages
  • 1839
  • 1840
  • 1841
  • More pages
  • 5634
  • Next