LogoThread Easy
  • Explorar
  • Criar thread
LogoThread Easy

Seu parceiro completo para threads do Twitter

© 2025 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

Gm we find ourselves in the woods again on this fine, little chilly, morning!

Gm we find ourselves in the woods again on this fine, little chilly, morning!

gpus and tractors Neural networks from Scratch book: https://t.co/hyMkWyUP7R https://t.co/8WGZRkUGsn

avatar for Harrison Kinsley
Harrison Kinsley
Thu Dec 11 13:24:47
[开源推荐] TEN Framework: 工业级开源实时多模态 AI  Agent 构建框架

如果说 LangChain 是为了解决 LLM 文本逻辑的编排,那么 @TenFramework 就是为了解决“实时音/视频流 + AI”的复杂编排。它填补了从“简单的 Chatbot”到“像人一样听得见、看得着、说得出的实时助理”之间的巨大技术鸿沟。

TEN 解决了什么问题
在 TEN 出现之前,要开发一个具备“听(ASR)、想(LLM)、说(TTS)”甚至“看(Vision)”的实时语音助手,开发者需要面临极其痛苦的碎片化集成工作:
· “胶水代码”地狱:你需要自己写代码去粘合 Deepgram(听)、OpenAI(想)和 ElevenLabs(说),处理 WebSocket 断连、音频格式转换和缓冲。
· 延迟失控:各个环节的延迟叠加,很容易让对话变得“卡顿”,无法做到打断(Interruptible)和实时响应。
· 多语言混合难题:底层音视频处理往往需要 C++ 的高性能,而 AI 逻辑又依赖 Python 生态,跨语言调试非常困难。

TEN Framework 的解决方案:
它提供了一套标准化的 “总线”,让你可以像搭乐高一样,把不同的 AI 模型和能力模块扩展插上去,框架自动处理底层的数据流转和并发。

技术架构深度解析
TEN 的设计哲学是 模块化 和 图驱动。
1. TEN Graph(可视化编排):
· TEN 的杀手级功能。它提供了一个可视化编辑器 (TEN Designer),你可以通过拖拽的方式定义数据流向。
· 例如:麦克风音频 -> 降噪模块 -> ASR模块 -> LLM模块 -> TTS模块 -> 扬声器。你可以在界面上直接把“OpenAI”换成“Gemini”,或者插入一个“实时翻译”节点,无需重写底层代码。

2. 多语言混合运行时 (Polyglot Runtime):
· 它允许不同语言写的扩展在同一个应用中协同工作。
· C++:用于处理高性能的音视频编解码、RTC 传输(如 Agora SD-RTN)。
· Python:用于处理 LLM 逻辑、工具调用等 AI 业务。
· Go:用于高并发的网络服务。

3. 端云协同 (Edge-Cloud Integration):
· 它支持将部分轻量级模型(如唤醒词检测、VAD)运行在边缘设备(甚至 ESP32 这种单片机)上,而将复杂推理放在云端,实现成本和延迟的最优解。

开源项目

[开源推荐] TEN Framework: 工业级开源实时多模态 AI Agent 构建框架 如果说 LangChain 是为了解决 LLM 文本逻辑的编排,那么 @TenFramework 就是为了解决“实时音/视频流 + AI”的复杂编排。它填补了从“简单的 Chatbot”到“像人一样听得见、看得着、说得出的实时助理”之间的巨大技术鸿沟。 TEN 解决了什么问题 在 TEN 出现之前,要开发一个具备“听(ASR)、想(LLM)、说(TTS)”甚至“看(Vision)”的实时语音助手,开发者需要面临极其痛苦的碎片化集成工作: · “胶水代码”地狱:你需要自己写代码去粘合 Deepgram(听)、OpenAI(想)和 ElevenLabs(说),处理 WebSocket 断连、音频格式转换和缓冲。 · 延迟失控:各个环节的延迟叠加,很容易让对话变得“卡顿”,无法做到打断(Interruptible)和实时响应。 · 多语言混合难题:底层音视频处理往往需要 C++ 的高性能,而 AI 逻辑又依赖 Python 生态,跨语言调试非常困难。 TEN Framework 的解决方案: 它提供了一套标准化的 “总线”,让你可以像搭乐高一样,把不同的 AI 模型和能力模块扩展插上去,框架自动处理底层的数据流转和并发。 技术架构深度解析 TEN 的设计哲学是 模块化 和 图驱动。 1. TEN Graph(可视化编排): · TEN 的杀手级功能。它提供了一个可视化编辑器 (TEN Designer),你可以通过拖拽的方式定义数据流向。 · 例如:麦克风音频 -> 降噪模块 -> ASR模块 -> LLM模块 -> TTS模块 -> 扬声器。你可以在界面上直接把“OpenAI”换成“Gemini”,或者插入一个“实时翻译”节点,无需重写底层代码。 2. 多语言混合运行时 (Polyglot Runtime): · 它允许不同语言写的扩展在同一个应用中协同工作。 · C++:用于处理高性能的音视频编解码、RTC 传输(如 Agora SD-RTN)。 · Python:用于处理 LLM 逻辑、工具调用等 AI 业务。 · Go:用于高并发的网络服务。 3. 端云协同 (Edge-Cloud Integration): · 它支持将部分轻量级模型(如唤醒词检测、VAD)运行在边缘设备(甚至 ESP32 这种单片机)上,而将复杂推理放在云端,实现成本和延迟的最优解。 开源项目

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Thu Dec 11 13:24:34
✨ I updated Photo AI's video model to @Kling_ai 2.6 now

By default it also generates audio (like Veo 3 does) and if you prompt for it it also produces voice, and it's pretty realistic too

I'd say the cadence of the voice can be improved to be a bit more real, but it's definitely getting there

It's just one click, just generate an AI photo first then hover over it and press [ 📼 Make video ]

It's 3x more expensive, but I sell it below cost (5 credits) so that you all sign up to Photo AI and generate your UGC influencers with me 😊

Here's my 100% AI influencer telling what she thinks of the @EU_Commission

✨ I updated Photo AI's video model to @Kling_ai 2.6 now By default it also generates audio (like Veo 3 does) and if you prompt for it it also produces voice, and it's pretty realistic too I'd say the cadence of the voice can be improved to be a bit more real, but it's definitely getting there It's just one click, just generate an AI photo first then hover over it and press [ 📼 Make video ] It's 3x more expensive, but I sell it below cost (5 credits) so that you all sign up to Photo AI and generate your UGC influencers with me 😊 Here's my 100% AI influencer telling what she thinks of the @EU_Commission

🇪🇺 https://t.co/NdorAWrhrB @euacc 📸 https://t.co/lAyoqmT9Hv $115K/m 🏡 https://t.co/1oqUgfDEsx $36K/m 🛰 https://t.co/ZHSvI2wRou $42K/m 🌍 https://t.co/UXK5AFra0o $14K/m 👙 https://t.co/RyXpqGvdBB $14K/m 💾 https://t.co/M1hEUBB6da $6K

avatar for @levelsio
@levelsio
Thu Dec 11 13:13:28
新视频上线——GPT-5.2来了!实测对比Opus 4.5

试了 GPT-5.2,它怎么那么喜欢暗黑模式啊😂

让它画个书房,黑乎乎一片,提示两次才调亮;让它画书柜,书放柜子顶上…

同样的任务 Opus 4.5 一次搞定

不是说 GPT 不行,是 Opus 在编程方面真的太稳了。

期待明天 5.2 正式发布,看它的强项到底是啥

新视频上线——GPT-5.2来了!实测对比Opus 4.5 试了 GPT-5.2,它怎么那么喜欢暗黑模式啊😂 让它画个书房,黑乎乎一片,提示两次才调亮;让它画书柜,书放柜子顶上… 同样的任务 Opus 4.5 一次搞定 不是说 GPT 不行,是 Opus 在编程方面真的太稳了。 期待明天 5.2 正式发布,看它的强项到底是啥

https://t.co/IwYR2peFDp

avatar for nicekate
nicekate
Thu Dec 11 13:12:57
RT @seclink: 当你感觉自己非常了不起时,推荐大家看一看 📷https://t.co/a0poG19tCB上的基础知识,尤其是筛选哪些高端岗位(如负责人、资深专家、专家、研究员...),看一看你距离哪些高薪岗位还有都是多少距离。

然后你可以利用…

RT @seclink: 当你感觉自己非常了不起时,推荐大家看一看 📷https://t.co/a0poG19tCB上的基础知识,尤其是筛选哪些高端岗位(如负责人、资深专家、专家、研究员...),看一看你距离哪些高薪岗位还有都是多少距离。 然后你可以利用…

找工作、找面试题、改简历、模拟面试。关注: 创业(冷启动) | 认知心理学|智能体 | 强化学习 building:https://t.co/A4YmEz90B8

avatar for Y11
Y11
Thu Dec 11 13:10:36
这不(金融机构客户尽职调查和客户身份资料及交易记录保存管理办法)在2026年1月1日正式实施了嘛,单笔交易超5000元或等值1000美元,就得核实汇款人身份……

正好总结一下这两天我从内地中行向香港中行汇款经验:
- “跨境支付通”虽快,但仅支持人民币和港币,且占用个人便利化购汇额度。
- 美元需通过“跨境汇款”功能操作。若账户内无美元,需先完成购汇。(我在2022年到柜台兑换过一些美金现钞,当时才6.38)
- 通过中行手机App向境外中行汇款,手续费与电讯费全免。
- 汇款前,务必在App内申请提升借记卡的单日跨境汇款限额,确保额度充足(借记卡-限额设置-账户提额申请)

到账时效参考:
- 非工作时间汇出,次日到账,用时约17小时。
- 工作时间汇出,当日到账,用时约5小时

这不(金融机构客户尽职调查和客户身份资料及交易记录保存管理办法)在2026年1月1日正式实施了嘛,单笔交易超5000元或等值1000美元,就得核实汇款人身份…… 正好总结一下这两天我从内地中行向香港中行汇款经验: - “跨境支付通”虽快,但仅支持人民币和港币,且占用个人便利化购汇额度。 - 美元需通过“跨境汇款”功能操作。若账户内无美元,需先完成购汇。(我在2022年到柜台兑换过一些美金现钞,当时才6.38) - 通过中行手机App向境外中行汇款,手续费与电讯费全免。 - 汇款前,务必在App内申请提升借记卡的单日跨境汇款限额,确保额度充足(借记卡-限额设置-账户提额申请) 到账时效参考: - 非工作时间汇出,次日到账,用时约17小时。 - 工作时间汇出,当日到账,用时约5小时

🧠在家居士 | 🥦素食者 | 🏃🏻马拉松爱好者 | 💰省钱小能手 | 搭🪜技术资深学者 | 👨‍💻科技宅 | 🆕更新狂 | 🆅 六边型战五渣

avatar for Geek
Geek
Thu Dec 11 13:05:15
  • Previous
  • 1
  • More pages
  • 1003
  • 1004
  • 1005
  • More pages
  • 5634
  • Next