LogoThread Easy
  • 探索
  • 線程創作
LogoThread Easy

Twitter 線程的一站式夥伴

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

微软刚刚最新放出来一款轻量级实时TTS:VibeVoice-Realtime-0.5B,主打低延迟、流式输入、长音频生成

首包音频延迟约300毫秒,WER 2%、说话人相似度0.69

文本可以逐段灌入,无需等全部答案生成,文本还在往外蹦,声音就已经开口说了

交错窗口设计,一边读新文本,一边用扩散模型续写声学潜码,实现边说边生成

可连续合成约10分钟语音
这个版本仅支持单说话人、英语

#TTS #VibeVoiceRealtime

微软刚刚最新放出来一款轻量级实时TTS:VibeVoice-Realtime-0.5B,主打低延迟、流式输入、长音频生成 首包音频延迟约300毫秒,WER 2%、说话人相似度0.69 文本可以逐段灌入,无需等全部答案生成,文本还在往外蹦,声音就已经开口说了 交错窗口设计,一边读新文本,一边用扩散模型续写声学潜码,实现边说边生成 可连续合成约10分钟语音 这个版本仅支持单说话人、英语 #TTS #VibeVoiceRealtime

github:https://t.co/15OdlHURQw HF:https://t.co/u3Vx8rPdLO

avatar for AIGCLINK
AIGCLINK
Fri Dec 05 01:33:05
确实意义重大!

NotebookLM 将聊天自定义的字符限制从 500 个字符增加到 10,000 个字符,可以创建更详细的角色了。

顺便提一句,Google 把 nano banana PRO加入到了Google slides, 虽然现在生成的每一页slide都是图片版的,但已经可以支持图片级别的编辑。

这两天正在做一个产品PPT,多少有点感悟。
基于模板生成PPT的服务商该思考一下接下来怎么走了。

确实意义重大! NotebookLM 将聊天自定义的字符限制从 500 个字符增加到 10,000 个字符,可以创建更详细的角色了。 顺便提一句,Google 把 nano banana PRO加入到了Google slides, 虽然现在生成的每一页slide都是图片版的,但已经可以支持图片级别的编辑。 这两天正在做一个产品PPT,多少有点感悟。 基于模板生成PPT的服务商该思考一下接下来怎么走了。

行道途中。非求速成,惟求通达。 2023 年扎进AI ,打通Know-How,不少赚钱项目,踩过坑,也见过光。 围城里待得够久了,出来聊聊世界,聊聊技术、聊聊赚钱。

avatar for 凡人小北
凡人小北
Fri Dec 05 01:30:44
Hugging Face Pro 用户可以通过 ZeroGPU 每天调用约 500 次 Z-Image-Turbo。

免费用户也能每天调用大概 80 次 Z-Image-Turbo

连上 MCP,既可以在 Hugging chat 上调用,也可以在LM Studio 里调用 或其他MCP客户端

嘎嘎香,图片生成速度嘎嘎快

示例里我用的提示词:调用 Tongyi-MAl/Z-Image-Turbo 生成植物大战🍓僵尸的图片,连续生成3张,默认1024x1024,卡通

Tongyi-MAl/Z-Image-Turbo 改成 gr1_z_image_turbo_generate 更好

Hugging Face Pro 用户可以通过 ZeroGPU 每天调用约 500 次 Z-Image-Turbo。 免费用户也能每天调用大概 80 次 Z-Image-Turbo 连上 MCP,既可以在 Hugging chat 上调用,也可以在LM Studio 里调用 或其他MCP客户端 嘎嘎香,图片生成速度嘎嘎快 示例里我用的提示词:调用 Tongyi-MAl/Z-Image-Turbo 生成植物大战🍓僵尸的图片,连续生成3张,默认1024x1024,卡通 Tongyi-MAl/Z-Image-Turbo 改成 gr1_z_image_turbo_generate 更好

AI and tech aficionado, keen on radios and e-readers. 🌐 https://t.co/aW55vLd67a

avatar for nicekate
nicekate
Fri Dec 05 01:30:11
谷歌上线了由 Gemini 3 驱动的 Deep Think 模式

直接把 ARC 2 拉到了 45.1 分,HLE 干到了 41 分,提升太离谱了

目前 Ultra 用户可以用,点击左侧 Deep Think 后右侧选择思考

谷歌上线了由 Gemini 3 驱动的 Deep Think 模式 直接把 ARC 2 拉到了 45.1 分,HLE 干到了 41 分,提升太离谱了 目前 Ultra 用户可以用,点击左侧 Deep Think 后右侧选择思考

详情:

avatar for 歸藏(guizang.ai)
歸藏(guizang.ai)
Fri Dec 05 01:27:26
RT @NetGhost15: @maddenifico It's the concluding scene of a performance describing Ukrainian history through the ages. 2021 Independence Da…

RT @NetGhost15: @maddenifico It's the concluding scene of a performance describing Ukrainian history through the ages. 2021 Independence Da…

Root node of the web of threads: https://t.co/ifH80GcLpo

avatar for James Torre
James Torre
Fri Dec 05 01:26:49
RT @staticmaker1: "boring" water rating app.

solo founder.

marketing via TikTok.

monetization via subscriptions.

generates $24,000 a mo…

RT @staticmaker1: "boring" water rating app. solo founder. marketing via TikTok. monetization via subscriptions. generates $24,000 a mo…

Discovering "boring" businesses at https://t.co/VrB2vWopEc. Sharing "boring" business opportunities at https://t.co/1qQOVZrUXW.

avatar for staticmaker
staticmaker
Fri Dec 05 01:25:59
  • Previous
  • 1
  • More pages
  • 1552
  • 1553
  • 1554
  • More pages
  • 5634
  • Next