LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

This is silly imo
Unless the argument is that they'll face other bottlenecks like power (they really won't) or interconnect or storage or something else, this capacity can be fully utilized

This is silly imo Unless the argument is that they'll face other bottlenecks like power (they really won't) or interconnect or storage or something else, this capacity can be fully utilized

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Dec 01 04:03:10
想要在项目中实现实时语音转文字,通常只能选云端 API,不仅贵还有考虑数据隐私问题。

而本地部署 Whisper 虽然免费,但处理流式音频时的延迟和断句体验往往不尽人意。

偶然在 GitHub 发现 WhisperLiveKit 这个开源项目,提供了一套完整的本地实时语音识别与翻译解决方案,专门优化了流式传输的延迟问题。

不仅支持高精度的实时转写,还内置了说话人识别(Diarization)和语音活动检测(VAD),能精准区分谁在说话以及何时停顿。

GitHub:https://t.co/SVCcyqdqhG

后端极其灵活,支持接入 faster-whisper 或专为 Apple Silicon 优化的 mlx-whisper 引擎,甚至整合了 NLLW 模型实现 200 种语言的实时翻译。

项目包含现成的 Python 服务端和 Web 前端示例,支持 Docker 部署。如果想搭建一个隐私安全、低延迟的会议记录或同传系统,这是个非常扎实的基础设施。

想要在项目中实现实时语音转文字,通常只能选云端 API,不仅贵还有考虑数据隐私问题。 而本地部署 Whisper 虽然免费,但处理流式音频时的延迟和断句体验往往不尽人意。 偶然在 GitHub 发现 WhisperLiveKit 这个开源项目,提供了一套完整的本地实时语音识别与翻译解决方案,专门优化了流式传输的延迟问题。 不仅支持高精度的实时转写,还内置了说话人识别(Diarization)和语音活动检测(VAD),能精准区分谁在说话以及何时停顿。 GitHub:https://t.co/SVCcyqdqhG 后端极其灵活,支持接入 faster-whisper 或专为 Apple Silicon 优化的 mlx-whisper 引擎,甚至整合了 NLLW 模型实现 200 种语言的实时翻译。 项目包含现成的 Python 服务端和 Web 前端示例,支持 Docker 部署。如果想搭建一个隐私安全、低延迟的会议记录或同传系统,这是个非常扎实的基础设施。

💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily

avatar for GitHubDaily
GitHubDaily
Mon Dec 01 04:00:30
豆包也发布了类似的手机助手解决方案,会跟国产手机厂商合作放到系统里面推出

- 支持通过电源键、语音识别和耳机唤醒
- 支持沉浸式实时通话(带视频)和语音修图
- 支持操作手机,可以跨APP操作完成复杂任务
- 知识记忆能力,可以记住图片、文本、日程之类信息

豆包也发布了类似的手机助手解决方案,会跟国产手机厂商合作放到系统里面推出 - 支持通过电源键、语音识别和耳机唤醒 - 支持沉浸式实时通话(带视频)和语音修图 - 支持操作手机,可以跨APP操作完成复杂任务 - 知识记忆能力,可以记住图片、文本、日程之类信息

关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design) AIGC 周刊主理人|公众号:歸藏的AI工具箱

avatar for 歸藏(guizang.ai)
歸藏(guizang.ai)
Mon Dec 01 03:56:28
> gigawatt class datacenter, dawn-dusk orbit
> by 2035
Many square kilometers of panels, hundreds of thousands of GPUs, radiators… That's millions of kilograms at least. They'll need solid reusable capacity for that.

> gigawatt class datacenter, dawn-dusk orbit > by 2035 Many square kilometers of panels, hundreds of thousands of GPUs, radiators… That's millions of kilograms at least. They'll need solid reusable capacity for that.

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Dec 01 03:55:49
Our team is holding a Diffusion Hangout for researchers at NeurIPS 2025. Sign up and stop by if you're at the conference this year! https://t.co/qYfOeVMoQF

Our team is holding a Diffusion Hangout for researchers at NeurIPS 2025. Sign up and stop by if you're at the conference this year! https://t.co/qYfOeVMoQF

founder @midjourney, previously founded leap motion, before that was at nasa and max planck - vibeposting @davidvibesonly

avatar for David
David
Mon Dec 01 03:52:47
a counterfactual timeline from Gemini (history buffs can nitpick but it'll serve for a quick example)

a counterfactual timeline from Gemini (history buffs can nitpick but it'll serve for a quick example)

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Dec 01 03:46:18
  • Previous
  • 1
  • More pages
  • 1929
  • 1930
  • 1931
  • More pages
  • 5634
  • Next