LogoThread Easy
  • Explorar
  • Componer hilo
LogoThread Easy

Tu compañero integral para hilos de Twitter

© 2025 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

RT @josedonato__: kudos to @CloudflareDev team, cloudflare dashboard keeps improving everyday

RT @josedonato__: kudos to @CloudflareDev team, cloudflare dashboard keeps improving everyday

building workers observability @cloudflaredev, prev founder @baselimehq (acquired by cloudflare), prev aerodynamicist

avatar for boris tane
boris tane
Sun Nov 02 12:49:04
为什么可以原生输出5分钟的不穿帮的视频,

它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。

模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂

在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了

(6/6)

为什么可以原生输出5分钟的不穿帮的视频, 它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。 模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂 在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了 (6/6)

分享一些好用、优雅的 AI 、工作流和创作方式,一起边学边做,前字节coder, Al and tech Educator, LearnPrompt founder

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:53
还可以看看人物第一视角口播卖货,

重点看人物的嘴形、眨眼、手部动作,虽然目前是没有声音的,但一分钟的画面里面没有出现过嘴形来回循环播放的片段,而且手部晃动这个香水的时候,瓶子里的液体也会对应细微晃动。

(5/6)

还可以看看人物第一视角口播卖货, 重点看人物的嘴形、眨眼、手部动作,虽然目前是没有声音的,但一分钟的画面里面没有出现过嘴形来回循环播放的片段,而且手部晃动这个香水的时候,瓶子里的液体也会对应细微晃动。 (5/6)

为什么可以原生输出5分钟的不穿帮的视频, 它依托了一种叫视频续写任务的预训练方式。在训练的时候,LongCat-Video看的不是零碎的短片,而是大量的连续剧。它的大脑天生就在思考接下来会发生什么,而不是这个画面应该长什么样。 模型在看连续剧的时候,不是一帧一帧地看,而是一段一段、一个事件一个事件地看。它理解的是“动作的起承转合”,这是一种叫Block-Causal Attention的机制,这样生成的长时间的动作不会轻易断裂 在生成长视频时,LongCat-Video还会把前面算过的不变的东西,比如背景里的那栋楼,先缓存起来,不用每一帧都重新算一遍,这样就可以提升到5分钟了 (6/6)

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:52
实测美团第一个AI视频模型LongCat-Video,13.6B参数,单个模型就能完成文生视频,图生视频,视频续写,以及生成超长视频,输出的视频参数是720p,30fps。发动了面子果实,找到美团LongCat团队帮我开了内部测试权限。

比如这个视频,你能看出从第几秒开始是我用LongCat-Video续写出来的吗?👇

(1/6)

实测美团第一个AI视频模型LongCat-Video,13.6B参数,单个模型就能完成文生视频,图生视频,视频续写,以及生成超长视频,输出的视频参数是720p,30fps。发动了面子果实,找到美团LongCat团队帮我开了内部测试权限。 比如这个视频,你能看出从第几秒开始是我用LongCat-Video续写出来的吗?👇 (1/6)

答案是2秒之后全部都是生成的内容。 LongCat-Video很擅长这种第一视角的穿越视频,甚至可以一次性生成5分钟的穿越视频,中间过程非常自然连贯,与真实世界非常相似。 (2/6)

avatar for 卡尔的AI沃茨
卡尔的AI沃茨
Sun Nov 02 12:45:47
前两天接一个「3D 模型 AI 生成技术」的咨询,除了常规聊生成技术的原理和门槛、落地情况,Tripo、混元、字节、Meshy 等不同团队和模型情况...

咨询团队知道我有「3D打印/激光雕刻」这个行业的从业经历,问了我一个问题:3D 模型 AI 生成技术的未来,在不在 3D 打印行业?这个技术发展到什么程度,能促进 3D 打印机进一步普及?

这个问题我有点回答不好,直觉上 AI 生成技术应该能把想象力无限放大,但实际上拓竹 3D 打印机和 Tripo 的合作,没激起太大水花,3D 打印还是实用工具为主,偶有热门 IP 打印的短暂热度,貌似生成技术的创意性和想象力,没有让 3D 打印用户有太大兴趣,至于说促进 3D 打印机普及,就更谈不上了,毕竟他们还有太多打印问题没解决。

感觉 3D 模型生成技术,未来还是在实时生成世界模型上,这个方向对 3D 模型有更广泛和个性化的需求,而且也在快速发展中,不局限于游戏方向。

前两天接一个「3D 模型 AI 生成技术」的咨询,除了常规聊生成技术的原理和门槛、落地情况,Tripo、混元、字节、Meshy 等不同团队和模型情况... 咨询团队知道我有「3D打印/激光雕刻」这个行业的从业经历,问了我一个问题:3D 模型 AI 生成技术的未来,在不在 3D 打印行业?这个技术发展到什么程度,能促进 3D 打印机进一步普及? 这个问题我有点回答不好,直觉上 AI 生成技术应该能把想象力无限放大,但实际上拓竹 3D 打印机和 Tripo 的合作,没激起太大水花,3D 打印还是实用工具为主,偶有热门 IP 打印的短暂热度,貌似生成技术的创意性和想象力,没有让 3D 打印用户有太大兴趣,至于说促进 3D 打印机普及,就更谈不上了,毕竟他们还有太多打印问题没解决。 感觉 3D 模型生成技术,未来还是在实时生成世界模型上,这个方向对 3D 模型有更广泛和个性化的需求,而且也在快速发展中,不局限于游戏方向。

专注 - Context Engineering, AI(Coding)Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴 🔗 信息卡提示词 🔽

avatar for meng shao
meng shao
Sun Nov 02 12:41:54
Knowledge is a person’s true beauty—an invisible, secure treasure. It is the teacher of teachers, the companion in foreign lands, and the supreme divine blessing. Among kings, the learned are honored; the unlearned, even if rich, are like animals.

Knowledge is a person’s true beauty—an invisible, secure treasure. It is the teacher of teachers, the companion in foreign lands, and the supreme divine blessing. Among kings, the learned are honored; the unlearned, even if rich, are like animals.

RL and efficient distributed pretraining • eXperiments lab • memes and training lores

avatar for tokenbender
tokenbender
Sun Nov 02 12:40:03
  • Previous
  • 1
  • More pages
  • 1332
  • 1333
  • 1334
  • More pages
  • 2117
  • Next