探索
撰写 Thread

Thread Easy

您的一体化 Twitter 线程助手

© 2025 Thread Easy All Rights Reserved.

探索

最新在前，按卡片方式浏览线程

作者账号

起始日期

结束日期

模糊预览图

开启时会模糊预览图，关闭后正常显示

RT @swyx: One thing I'm finding from NeurIPS chatter is that SOTA-competitive open weights + RL FT is presenting an incredibly strong/compe…

RT @swyx: One thing I'm finding from NeurIPS chatter is that SOTA-competitive open weights + RL FT is presenting an incredibly strong/compe…

Co-founder & CEO @HuggingFace 🤗, the open and collaborative platform for AI builders

Thu Dec 04 00:50:12

可灵这周疯狂上新啊，O1刚刚玩明白就又发Kling 2.6了。

我总结了X种O1的玩法，

包括修改图片、视频、主体、文字，多图融合生成视频，在视频中增删替换内容，修改视频背景，天气，风格，修改主体颜色，切换视频的视角和景别，还能给视频加特效，复刻人物动作等等等等

目前@Kling_ai最多是支持【7张图片】或者【1个视频 + 4张图片】的组合修改模式。

（1/13）

可灵这周疯狂上新啊，O1刚刚玩明白就又发Kling 2.6了。我总结了X种O1的玩法，包括修改图片、视频、主体、文字，多图融合生成视频，在视频中增删替换内容，修改视频背景，天气，风格，修改主体颜色，切换视频的视角和景别，还能给视频加特效，复刻人物动作等等等等目前@Kling_ai最多是支持【7张图片】或者【1个视频 + 4张图片】的组合修改模式。（1/13）

一、多图融合我这里使用了一张写实的背景和2D动画的人物，组合出来的视频不仅都能保持各自的风格，还能很好的融合在一起，整个画面都很合理，所有元素出现的位置都对，人物动作也很自然。（2/13）

卡尔的AI沃茨

Thu Dec 04 00:46:29

I really don't understand this intuition that the state is the enemy of the business. The whole point of the massive centralized bureaucracy under authoritarian mandate is largely to have less trouble doing precisely *this*. What happened to «Peace, Order, and Good Government»?

I really don't understand this intuition that the state is the enemy of the business. The whole point of the massive centralized bureaucracy under authoritarian mandate is largely to have less trouble doing precisely this. What happened to «Peace, Order, and Good Government»?

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)

Thu Dec 04 00:45:22

RT @lsanger: Wikipedia earned $184M from donations last year. Keeping the servers running costs lest than $5M. They don't need your money.

RT @lsanger: Wikipedia earned $184M from donations last year. Keeping the servers running costs lest than $5M. They don't need your money.

Thu Dec 04 00:44:40

[开源推荐] Smart Turn v3.1: 针对语音对话中“轮次检测”的重要更新，通过引入真实人类语音数据而非仅仅依赖合成语音，大幅提升模型判断“用户是否说完话”的准确性，让 AI 的对话反应更加自然 @trydaily

🚀 核心亮点：准确率显著提升
· 告别纯合成数据：v3.1 最大的突破在于引入了由合作伙伴（Liva AI, Midcentury, MundoAI）提供的真实人类语音样本（特别是英语和西班牙语）。
· 数据对比：相比 v3.0，新版本在英语环境下的准确率从 88.3% 飙升至约 95%，西班牙语也提升至 90% 以上。
· 解决痛点：以前依赖 TTS 合成数据训练，缺乏人类说话时的自然停顿和细微语气。新数据让模型能更精准地识别“真停顿”与“假停顿”。

🛠️ 技术细节与灵活性
本次更新提供了两个模型版本，以适应不同的硬件需求：
· CPU 版（8MB，Int8 量化）：体积小、速度快，适合大多数边缘计算或普通服务器，推理速度极快（低至 12ms）。
· GPU 版（32MB，未量化）：体积稍大，但在 GPU 上运行效率更高，且准确率比 CPU 版再高出约 1%。

🔄 极简升级体验
· 无缝替换：v3.1 保持了与 v3.0 相同的架构。如果你已经是用户，只需替换 ONNX 模型文件，无需修改推理代码。
· 生态集成：新模型将直接集成到下一版 Pipecat 框架中，开发者几乎可以“零代码”享受到性能提升。

📊 开放与开源
不仅开源了模型权重，还在 HuggingFace 上公开了用于训练和测试的新数据集（smart-turn-data-v3.1），方便社区进一步研究或微调。

阅读原文

[开源推荐] Smart Turn v3.1: 针对语音对话中“轮次检测”的重要更新，通过引入真实人类语音数据而非仅仅依赖合成语音，大幅提升模型判断“用户是否说完话”的准确性，让 AI 的对话反应更加自然 @trydaily 🚀 核心亮点：准确率显著提升 · 告别纯合成数据：v3.1 最大的突破在于引入了由合作伙伴（Liva AI, Midcentury, MundoAI）提供的真实人类语音样本（特别是英语和西班牙语）。 · 数据对比：相比 v3.0，新版本在英语环境下的准确率从 88.3% 飙升至约 95%，西班牙语也提升至 90% 以上。 · 解决痛点：以前依赖 TTS 合成数据训练，缺乏人类说话时的自然停顿和细微语气。新数据让模型能更精准地识别“真停顿”与“假停顿”。 🛠️ 技术细节与灵活性本次更新提供了两个模型版本，以适应不同的硬件需求： · CPU 版（8MB，Int8 量化）：体积小、速度快，适合大多数边缘计算或普通服务器，推理速度极快（低至 12ms）。 · GPU 版（32MB，未量化）：体积稍大，但在 GPU 上运行效率更高，且准确率比 CPU 版再高出约 1%。 🔄 极简升级体验 · 无缝替换：v3.1 保持了与 v3.0 相同的架构。如果你已经是用户，只需替换 ONNX 模型文件，无需修改推理代码。 · 生态集成：新模型将直接集成到下一版 Pipecat 框架中，开发者几乎可以“零代码”享受到性能提升。 📊 开放与开源不仅开源了模型权重，还在 HuggingFace 上公开了用于训练和测试的新数据集（smart-turn-data-v3.1），方便社区进一步研究或微调。阅读原文

邵猛，中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱：shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

Thu Dec 04 00:43:38

Q: When did the lesson of scaling sink in?

Hinton: Didn't really sink in till I heard a talk by @ilyasut in 2014

Q: When did the lesson of scaling sink in? Hinton: Didn't really sink in till I heard a talk by @ilyasut in 2014

Co-founder & Chief Scientist @yutori_ai. Prev: Senior Director leading FAIR Embodied AI @MetaAI and Professor @GeorgiaTech.

Dhruv Batra ✈️ NeurIPS

Thu Dec 04 00:43:28

Previous
1
1654
1655
1656
5634
Next