LogoThread Easy
  • 探索
  • 撰写 Thread
LogoThread Easy

您的一体化 Twitter 线程助手

© 2025 Thread Easy All Rights Reserved.

探索

最新在前,按卡片方式浏览线程

开启时会模糊预览图,关闭后正常显示

StepFun AI 表示,这个模型代表了一种全新的音频编辑范式:

不再从波形信号处理音频,而是像语言模型一样,用离散 token 表示语音,可通过自然语言指令完成情感、风格、语速等多维度的音频修改。

详细内容:https://t.co/0vTbSAZVIq

项目地址:https://t.co/1Q4sE34jXi

GitHub:https://t.co/fyvQjCcKhW

在线体验:

StepFun AI 表示,这个模型代表了一种全新的音频编辑范式: 不再从波形信号处理音频,而是像语言模型一样,用离散 token 表示语音,可通过自然语言指令完成情感、风格、语速等多维度的音频修改。 详细内容:https://t.co/0vTbSAZVIq 项目地址:https://t.co/1Q4sE34jXi GitHub:https://t.co/fyvQjCcKhW 在线体验:

学AI找小互,找小互,上 https://t.co/4PVaHEr5r3 ...

avatar for 小互
小互
Mon Nov 10 03:16:23
StepFun AI (阶跃星辰)发布LLM 级别的音频编辑模型: Step-Audio-EditX 

让语音也可以“像文本一样被编辑”

30亿参数(从130B压缩而来)
支持 零样本语音克隆与多轮可迭代编辑
支持语言:普通话、英语、四川话、粤语
它可以通过自然语言指令编辑音频的情绪、语气、风格甚至副语言特征

Step-Audio-EditX 在多项指标上超越了闭源商用模型 Minimax 与 Doubao

实验结果表明:

其在自然度、情感表达、音色一致性方面已接近甚至超越闭源商用系统。

情绪与风格控制能力达到业内领先水准。

StepFun AI (阶跃星辰)发布LLM 级别的音频编辑模型: Step-Audio-EditX 让语音也可以“像文本一样被编辑” 30亿参数(从130B压缩而来) 支持 零样本语音克隆与多轮可迭代编辑 支持语言:普通话、英语、四川话、粤语 它可以通过自然语言指令编辑音频的情绪、语气、风格甚至副语言特征 Step-Audio-EditX 在多项指标上超越了闭源商用模型 Minimax 与 Doubao 实验结果表明: 其在自然度、情感表达、音色一致性方面已接近甚至超越闭源商用系统。 情绪与风格控制能力达到业内领先水准。

StepFun AI 表示,这个模型代表了一种全新的音频编辑范式: 不再从波形信号处理音频,而是像语言模型一样,用离散 token 表示语音,可通过自然语言指令完成情感、风格、语速等多维度的音频修改。 详细内容:https://t.co/0vTbSAZVIq 项目地址:https://t.co/1Q4sE34jXi GitHub:https://t.co/fyvQjCcKhW 在线体验:

avatar for 小互
小互
Mon Nov 10 03:14:02
一键生成PPT的开源工具:Presentation-AI,一句话,流式自动生成可在线演示的PPT,https://t.co/3wVdDpgesT的开源方案

支持9套主题、本地大模型

设计主题、风格、图片可以深度定制,可以精细化调整
可以对生成的大纲进行审查、修改以及调整

#AIppt生成 #Presentation

一键生成PPT的开源工具:Presentation-AI,一句话,流式自动生成可在线演示的PPT,https://t.co/3wVdDpgesT的开源方案 支持9套主题、本地大模型 设计主题、风格、图片可以深度定制,可以精细化调整 可以对生成的大纲进行审查、修改以及调整 #AIppt生成 #Presentation

github:https://t.co/A4OhCkje7q

avatar for AIGCLINK
AIGCLINK
Mon Nov 10 03:08:57
@stevehou0 @StefanFSchubert @StevenGlinert Behold wypipo finance sex magick in action.
Coherus sells Loqtorzi to wypipos, leveraging vast insurance "services", boosting GDP and "manufacturing productivity" and employment. captures  $7113
Shanghai Junshi captures $1778
5x less productive!
Work smarter not harder, azns 😏

@stevehou0 @StefanFSchubert @StevenGlinert Behold wypipo finance sex magick in action. Coherus sells Loqtorzi to wypipos, leveraging vast insurance "services", boosting GDP and "manufacturing productivity" and employment. captures $7113 Shanghai Junshi captures $1778 5x less productive! Work smarter not harder, azns 😏

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Nov 10 03:05:27
构建高效 AI Agent 的核心框架——Claude Agent SDK Loop

来自 @omarsar0 的分享,他称其为 Claude Code 等先进系统的底层动力,适用于任何领域的 AI Agent 开发。框架简洁、灵活、可靠,建议收藏!

核心是一个三步循环,从任务输入开始,持续迭代直到输出最终结果:

1. 收集上下文(Gather Context)
   · 使用子 Agent 并行处理任务,隔离上下文窗口,高效传递关键信息。  
   · 通过自动压缩上下文(Claude Agent SDK 内置功能)以及Agentic/语义搜索(如结合 grep、tail 的文件系统搜索,或混合搜索策略)检索相关内容。  
   · 在 Agent 编码等场景中尤为高效。

2. 采取行动(Take Action) 
   · 调用工具执行操作:构建高效工具、标准化集成(如 MCP 服务器,为 Agent 提供关键上下文)、Bash 脚本、生成代码并获取反馈。  
   · 通过代码执行 + 路由优化,提升 MCP 效率和 token 利用率(类似 LLM 路由在 Agent 中的作用)。

3. 验证输出(Verify Output)  
   · 定义明确规则检查输出质量。  
   · 支持视觉反馈(多模态任务中关键)。  
   · 使用 LLM-as-a-Judge 基于模糊规则评估。  
   · 提醒:避免过度复杂化流程——简单任务优先用脚本技能,而非计算机 Agent。

整体框架强调上下文管理 → 行动反馈 → 输出验证的闭环迭代,帮助开发者构建更智能、适应性强的 AI Agent。

构建高效 AI Agent 的核心框架——Claude Agent SDK Loop 来自 @omarsar0 的分享,他称其为 Claude Code 等先进系统的底层动力,适用于任何领域的 AI Agent 开发。框架简洁、灵活、可靠,建议收藏! 核心是一个三步循环,从任务输入开始,持续迭代直到输出最终结果: 1. 收集上下文(Gather Context) · 使用子 Agent 并行处理任务,隔离上下文窗口,高效传递关键信息。 · 通过自动压缩上下文(Claude Agent SDK 内置功能)以及Agentic/语义搜索(如结合 grep、tail 的文件系统搜索,或混合搜索策略)检索相关内容。 · 在 Agent 编码等场景中尤为高效。 2. 采取行动(Take Action) · 调用工具执行操作:构建高效工具、标准化集成(如 MCP 服务器,为 Agent 提供关键上下文)、Bash 脚本、生成代码并获取反馈。 · 通过代码执行 + 路由优化,提升 MCP 效率和 token 利用率(类似 LLM 路由在 Agent 中的作用)。 3. 验证输出(Verify Output) · 定义明确规则检查输出质量。 · 支持视觉反馈(多模态任务中关键)。 · 使用 LLM-as-a-Judge 基于模糊规则评估。 · 提醒:避免过度复杂化流程——简单任务优先用脚本技能,而非计算机 Agent。 整体框架强调上下文管理 → 行动反馈 → 输出验证的闭环迭代,帮助开发者构建更智能、适应性强的 AI Agent。

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Mon Nov 10 03:02:24
Unitree has the biggest, and unique, gap between in-house robot policy and total R&D that went into driving their robots
I wonder how they plan to leverage that. Just selling the best research clankers at scale is unambitious.

Unitree has the biggest, and unique, gap between in-house robot policy and total R&D that went into driving their robots I wonder how they plan to leverage that. Just selling the best research clankers at scale is unambitious.

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Nov 10 02:59:00
  • Previous
  • 1
  • More pages
  • 307
  • 308
  • 309
  • More pages
  • 2131
  • Next