LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

在翻译各类文档的时候,有很多工具面对复杂的表格、公式和代码等内容,要么格式全乱,要么识别不了。

尤其是翻译学术论文、技术文档这类专业的内容时,一些术语的翻译更是让人头疼。

无独有偶,看到了 DocuTranslate 这个开源的本地文档翻译工具,能帮我们在保持文档原格式下完成翻译。

支持 PDF、Word、Excel、Markdown 等十余种文件格式,还能自动生成术语表保证翻译一致性。

GitHub:https://t.co/aGXhZLAL7U

更厉害的是,支持精确识别 PDF 中的表格、公式和代码块,并进行准确翻译。

同时,支持大部分主流的 AI 模型供应商平台,允许自定义提示词,以及并发高性能 AI 翻译。

提供 Windows、Mac 整合包直接下载使用,也可通过 pip 安装,在局域网内还可以多人同时使用。

在翻译各类文档的时候,有很多工具面对复杂的表格、公式和代码等内容,要么格式全乱,要么识别不了。 尤其是翻译学术论文、技术文档这类专业的内容时,一些术语的翻译更是让人头疼。 无独有偶,看到了 DocuTranslate 这个开源的本地文档翻译工具,能帮我们在保持文档原格式下完成翻译。 支持 PDF、Word、Excel、Markdown 等十余种文件格式,还能自动生成术语表保证翻译一致性。 GitHub:https://t.co/aGXhZLAL7U 更厉害的是,支持精确识别 PDF 中的表格、公式和代码块,并进行准确翻译。 同时,支持大部分主流的 AI 模型供应商平台,允许自定义提示词,以及并发高性能 AI 翻译。 提供 Windows、Mac 整合包直接下载使用,也可通过 pip 安装,在局域网内还可以多人同时使用。

💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily

avatar for GitHubDaily
GitHubDaily
Sat Nov 08 04:00:05
When neither side in a war has drone superiority, the result is paralysis (e.g., Ukraine). When one side has it, the result is a rout (e.g., Nagorno-Karabakh). Right now Russia has drone superiority over Europe and China over America.

When neither side in a war has drone superiority, the result is paralysis (e.g., Ukraine). When one side has it, the result is a rout (e.g., Nagorno-Karabakh). Right now Russia has drone superiority over Europe and China over America.

Professor of computer science at UW and author of '2040' and 'The Master Algorithm'. Into machine learning, AI, and anything that makes me curious.

avatar for Pedro Domingos
Pedro Domingos
Sat Nov 08 03:58:18
[开源推荐] MLX-Audio Studio: 开源 UI 工具,专为音频生成和处理设计。基于 MLX-Audio 库开发,支持 Apple Silicon 设备,允许用户在本地轻松生成和转录音频,支持多种后端选项,包括 MLX-Audio、Transformers 或其他如 OpenAI 的服务。 

核心功能
· 音频生成与转录:提供 TTS 和 STT 功能,用户可以通过简单界面输入文本生成音频,或上传音频文件进行转录。
· 多后端支持:灵活集成不同框架,用户可选择本地 MLX-Audio 模型或其他外部 API,实现自定义音频处理。
· 用户界面设计:现代化的 Web 界面,支持暗黑模式,包含模型选择、速度/音调/音量调节、长文本处理和音频播放器。界面直观,包括历史记录、设置和 API 访问入口。
· 扩展性:未来将添加更多任务,如语音克隆或高级编辑,增强音频应用的多样性。

再看看 MLX-Audio 核心功能
· 高效推理:利用 MLX 框架在 Apple Silicon 上原生运行,提供快速生成和处理,支持 8 位量化以减少内存占用和提升速度。
· 多语言支持:默认支持美式英语和英式英语,可通过可选依赖扩展到日语和普通话。
· 语音定制:内置多种语音预设(如 af_heart、af_nova、bf_emma),并支持速度调节(0.5x 到 2.0x)。
· 用户界面与 API:包括现代 Web UI(带 3D 音频可视化、文件上传和回放),以及基于 FastAPI 的 REST API(兼容 OpenAI 风格的 TTS 和 STT 接口)。
· 文件管理:生成的文件默认保存到 ~/.mlx_audio/outputs 目录,支持直接在 Finder 或 Explorer 中打开。
· Swift 集成:提供 mlx-swift-audio 包,用于 macOS 和 iOS 上的原生 TTS,支持流式生成和原始 PCM 输出。
· 其他特性:支持语音克隆(通过参考音频)、实时音频块生成,以及可选的流式处理和量化选项。

开源地址

[开源推荐] MLX-Audio Studio: 开源 UI 工具,专为音频生成和处理设计。基于 MLX-Audio 库开发,支持 Apple Silicon 设备,允许用户在本地轻松生成和转录音频,支持多种后端选项,包括 MLX-Audio、Transformers 或其他如 OpenAI 的服务。 核心功能 · 音频生成与转录:提供 TTS 和 STT 功能,用户可以通过简单界面输入文本生成音频,或上传音频文件进行转录。 · 多后端支持:灵活集成不同框架,用户可选择本地 MLX-Audio 模型或其他外部 API,实现自定义音频处理。 · 用户界面设计:现代化的 Web 界面,支持暗黑模式,包含模型选择、速度/音调/音量调节、长文本处理和音频播放器。界面直观,包括历史记录、设置和 API 访问入口。 · 扩展性:未来将添加更多任务,如语音克隆或高级编辑,增强音频应用的多样性。 再看看 MLX-Audio 核心功能 · 高效推理:利用 MLX 框架在 Apple Silicon 上原生运行,提供快速生成和处理,支持 8 位量化以减少内存占用和提升速度。 · 多语言支持:默认支持美式英语和英式英语,可通过可选依赖扩展到日语和普通话。 · 语音定制:内置多种语音预设(如 af_heart、af_nova、bf_emma),并支持速度调节(0.5x 到 2.0x)。 · 用户界面与 API:包括现代 Web UI(带 3D 音频可视化、文件上传和回放),以及基于 FastAPI 的 REST API(兼容 OpenAI 风格的 TTS 和 STT 接口)。 · 文件管理:生成的文件默认保存到 ~/.mlx_audio/outputs 目录,支持直接在 Finder 或 Explorer 中打开。 · Swift 集成:提供 mlx-swift-audio 包,用于 macOS 和 iOS 上的原生 TTS,支持流式生成和原始 PCM 输出。 · 其他特性:支持语音克隆(通过参考音频)、实时音频块生成,以及可选的流式处理和量化选项。 开源地址

专注 - Context Engineering, AI(Coding)Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴 🔗 信息卡提示词 🔽

avatar for meng shao
meng shao
Sat Nov 08 03:57:04
RT @arvidkahl: Oauth will never be the same. 

Error 431: Too Much Tongue.

RT @arvidkahl: Oauth will never be the same. Error 431: Too Much Tongue.

Building https://t.co/od97B0HVrk and https://t.co/666FnyVVE0 in Public. Raising all the boats with kindness. 🎙️ https://t.co/6w69DZmi8H · ✍️ https://t.co/lpnor5rsTW

avatar for Arvid Kahl
Arvid Kahl
Sat Nov 08 03:55:22
RT @rmaruy: Can't agree more. If AI existed 80 years ago, its most important pudit could have been Wittgenstein.

And these days, AI is als…

RT @rmaruy: Can't agree more. If AI existed 80 years ago, its most important pudit could have been Wittgenstein. And these days, AI is als…

Building @SakanaAILabs 🧠

avatar for hardmaru
hardmaru
Sat Nov 08 03:54:11
CamCloneMaster

Enabling Reference-based Camera Control for Video Generation

CamCloneMaster Enabling Reference-based Camera Control for Video Generation

discuss: https://t.co/xvZKxg8X7g

avatar for AK
AK
Sat Nov 08 03:53:21
  • Previous
  • 1
  • More pages
  • 485
  • 486
  • 487
  • More pages
  • 2131
  • Next