LogoThread Easy
  • 探索
  • 線程創作
LogoThread Easy

Twitter 線程的一站式夥伴

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

Beautiful write up by Greg. Finally someone beats Bill Ackman on X.

Agree with most - hard disagree with 16 and 32:

On 16: nations need sovereign AI; but is your AI sovereign if your GPU supply can be taken away by an exec order. Also, most sovereign AI project being led by un-imaginative government leadership. Don’t have hopes.

On 32: I work on AI agents day in and day out. They are no where as reliable even with all the advancements.

Beautiful write up by Greg. Finally someone beats Bill Ackman on X. Agree with most - hard disagree with 16 and 32: On 16: nations need sovereign AI; but is your AI sovereign if your GPU supply can be taken away by an exec order. Also, most sovereign AI project being led by un-imaginative government leadership. Don’t have hopes. On 32: I work on AI agents day in and day out. They are no where as reliable even with all the advancements.

AI @amazon. All views personal!

avatar for GDP
GDP
Sun Nov 02 12:49:32
RT @josedonato__: kudos to @CloudflareDev team, cloudflare dashboard keeps improving everyday

RT @josedonato__: kudos to @CloudflareDev team, cloudflare dashboard keeps improving everyday

building workers observability @cloudflaredev, prev founder @baselimehq (acquired by cloudflare), prev aerodynamicist

avatar for boris tane
boris tane
Sun Nov 02 12:49:04
为什么可以原生输出5分钟的不穿帮的视频,

它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。

模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂

在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了

(6/6)

为什么可以原生输出5分钟的不穿帮的视频, 它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。 模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂 在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了 (6/6)

分享一些好用、优雅的 AI 、工作流和创作方式,一起边学边做,前字节coder, Al and tech Educator, LearnPrompt founder

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:53
还可以看看人物第一视角口播卖货,

重点看人物的嘴形、眨眼、手部动作,虽然目前是没有声音的,但一分钟的画面里面没有出现过嘴形来回循环播放的片段,而且手部晃动这个香水的时候,瓶子里的液体也会对应细微晃动。

(5/6)

还可以看看人物第一视角口播卖货, 重点看人物的嘴形、眨眼、手部动作,虽然目前是没有声音的,但一分钟的画面里面没有出现过嘴形来回循环播放的片段,而且手部晃动这个香水的时候,瓶子里的液体也会对应细微晃动。 (5/6)

为什么可以原生输出5分钟的不穿帮的视频, 它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。 模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂 在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了 (6/6)

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:52
实测美团第一个AI视频模型LongCat-Video,13.6B参数,单个模型就能完成文生视频,图生视频,视频续写,以及生成超长视频,输出的视频参数是720p,30fps。发动了面子果实,找到美团LongCat团队帮我开了内部测试权限。

比如这个视频,你能看出从第几秒开始是我用LongCat-Video续写出来的吗?👇

(1/6)

实测美团第一个AI视频模型LongCat-Video,13.6B参数,单个模型就能完成文生视频,图生视频,视频续写,以及生成超长视频,输出的视频参数是720p,30fps。发动了面子果实,找到美团LongCat团队帮我开了内部测试权限。 比如这个视频,你能看出从第几秒开始是我用LongCat-Video续写出来的吗?👇 (1/6)

答案是2秒之后全部都是生成的内容。 LongCat-Video很擅长这种第一视角的穿越视频,甚至可以一次性生成5分钟的穿越视频,中间过程非常自然连贯,与真实世界非常相似。 (2/6)

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:47
前两天接一个「3D 模型 AI 生成技术」的咨询,除了常规聊生成技术的原理和门槛、落地情况,Tripo、混元、字节、Meshy 等不同团队和模型情况...

咨询团队知道我有「3D打印/激光雕刻」这个行业的从业经历,问了我一个问题:3D 模型 AI 生成技术的未来,在不在 3D 打印行业?这个技术发展到什么程度,能促进 3D 打印机进一步普及?

这个问题我有点回答不好,直觉上 AI 生成技术应该能把想象力无限放大,但实际上拓竹 3D 打印机和 Tripo 的合作,没激起太大水花,3D 打印还是实用工具为主,偶有热门 IP 打印的短暂热度,貌似生成技术的创意性和想象力,没有让 3D 打印用户有太大兴趣,至于说促进 3D 打印机普及,就更谈不上了,毕竟他们还有太多打印问题没解决。

感觉 3D 模型生成技术,未来还是在实时生成世界模型上,这个方向对 3D 模型有更广泛和个性化的需求,而且也在快速发展中,不局限于游戏方向。

前两天接一个「3D 模型 AI 生成技术」的咨询,除了常规聊生成技术的原理和门槛、落地情况,Tripo、混元、字节、Meshy 等不同团队和模型情况... 咨询团队知道我有「3D打印/激光雕刻」这个行业的从业经历,问了我一个问题:3D 模型 AI 生成技术的未来,在不在 3D 打印行业?这个技术发展到什么程度,能促进 3D 打印机进一步普及? 这个问题我有点回答不好,直觉上 AI 生成技术应该能把想象力无限放大,但实际上拓竹 3D 打印机和 Tripo 的合作,没激起太大水花,3D 打印还是实用工具为主,偶有热门 IP 打印的短暂热度,貌似生成技术的创意性和想象力,没有让 3D 打印用户有太大兴趣,至于说促进 3D 打印机普及,就更谈不上了,毕竟他们还有太多打印问题没解决。 感觉 3D 模型生成技术,未来还是在实时生成世界模型上,这个方向对 3D 模型有更广泛和个性化的需求,而且也在快速发展中,不局限于游戏方向。

专注 - Context Engineering, AI(Coding)Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴 🔗 信息卡提示词 🔽

avatar for meng shao
meng shao
Sun Nov 02 12:41:54
  • Previous
  • 1
  • More pages
  • 1332
  • 1333
  • 1334
  • More pages
  • 2118
  • Next