LogoThread Easy
  • Explorar
  • Componer hilo
LogoThread Easy

Tu compañero integral para hilos de Twitter

© 2025 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

我的产品简单简历 https://t.co/2vTyY4JaoL 开始一年一度双十一的特价活动啦,终生会员原价188元,现在特价 99 元。

去年的双十一活动我记得很成功,创下了收入的小新高,如果有要写简历的朋友,可以试试看。我很多次横向对比了市面上写简历的工具,不谦虚的说,在我看来算是挺易用也是很美观的。

我的产品简单简历 https://t.co/2vTyY4JaoL 开始一年一度双十一的特价活动啦,终生会员原价188元,现在特价 99 元。 去年的双十一活动我记得很成功,创下了收入的小新高,如果有要写简历的朋友,可以试试看。我很多次横向对比了市面上写简历的工具,不谦虚的说,在我看来算是挺易用也是很美观的。

独立开发者 自由职业 作品 - 简单简历 https://t.co/xMu5JFIGnr 五分钟打造程序员的金牌简历 课程 - 慕课网精英讲师 https://t.co/NTyFFrvHwL 经历 - 不上班的1000天 https://t.co/bonuLQCCsY 视频 - https://t.co/aQYLgujIyC

avatar for Viking
Viking
Mon Nov 10 00:51:20
小型 VLM + 自定义数据集微调 ≈ GPT-5,且便宜 50 倍!

来自 @LiquidAI_ 成员 @paulabartabajo_ 给 AI 工程师的实用建议。核心观点强调:在特定任务或领域,使用小型视觉语言模型(VLM)并基于自定义数据集进行微调,可以实现与大型通用模型(如 GPT-5)相当的准确性,同时显著降低成本(约 50 倍)。这体现了 AI 开发中的效率优先原则:小型模型在专用场景下往往更经济、更易部署,且通过微调能针对性优化性能,避免大模型的资源浪费。

开源项目
使用 Liquid AI 基础模型(LFM)和 LEAP SDK 构建的各种教程、示例和应用。演示了如何构建一个本地化的智能体工作流,用于自动解析发票文件。它强调数据隐私,因为整个过程在用户本地机器上运行,无需云服务或 API 密钥。

创建一个简单的 Python CLI,它可以监控指定文件夹中的新发票文件(通常为图像格式,如 PNG 或 JPEG),并从中提取结构化信息,例如金额和货币。然后,将提取的结果追加到 CSV 文件中,便于后续分析或记录。该工作流适用于处理日常账单或发票,展示了小型本地语言模型在实际任务中的应用潜力。根据测试,它能正确处理约 75% 的样本发票,突出模型的实用性和改进空间。

关键技术和模型
· @ollama:用于在本地运行和管理语言模型的框架,支持高效的模型推理。
· uv:一个高效的 Python 包管理器,用于处理依赖和脚本执行,提高开发效率。
· LFM2-VL-3B:Liquid AI 的视觉语言模型,负责从发票图像中提取原始文本描述,包括 OCR 功能。
· LFM2-1.2B-Extract:另一个 Liquid AI 模型,专用于将非结构化文本转换为结构化数据记录,例如 JSON 格式的金额和货币字段。

这些模型均为小型(nano 级),可在普通硬件上运行,强调成本效益和本地部署。

代码结构和工作原理
代码主要位于 src/invoice_parser/main.py,采用模块化设计,便于扩展。工作流分为以下步骤:
1. 文件监控:工具持续监视指定的目录(如 invoices/),检测新添加的发票文件。
2. 文本提取:一旦检测到新文件,LFM2-VL-3B 模型会处理图像,生成原始文本描述(例如,识别出 “Total: $100 USD” 等内容)。
3. 信息结构化:将提取的文本传递给 LFM2-1.2B-Extract 模型,它使用提示工程将文本转换为结构化数据,如 {"amount": 100, "currency": "USD"}。
4. 数据存储:将结构化结果追加到目录中的 bills.csv 文件,确保数据持久化。

整个过程是链式的(chained),类似于智能体协作:视觉模型充当“眼睛”,提取模型充当“大脑”。如果处理现有文件,可以通过命令行参数启用。

开源地址:

小型 VLM + 自定义数据集微调 ≈ GPT-5,且便宜 50 倍! 来自 @LiquidAI_ 成员 @paulabartabajo_ 给 AI 工程师的实用建议。核心观点强调:在特定任务或领域,使用小型视觉语言模型(VLM)并基于自定义数据集进行微调,可以实现与大型通用模型(如 GPT-5)相当的准确性,同时显著降低成本(约 50 倍)。这体现了 AI 开发中的效率优先原则:小型模型在专用场景下往往更经济、更易部署,且通过微调能针对性优化性能,避免大模型的资源浪费。 开源项目 使用 Liquid AI 基础模型(LFM)和 LEAP SDK 构建的各种教程、示例和应用。演示了如何构建一个本地化的智能体工作流,用于自动解析发票文件。它强调数据隐私,因为整个过程在用户本地机器上运行,无需云服务或 API 密钥。 创建一个简单的 Python CLI,它可以监控指定文件夹中的新发票文件(通常为图像格式,如 PNG 或 JPEG),并从中提取结构化信息,例如金额和货币。然后,将提取的结果追加到 CSV 文件中,便于后续分析或记录。该工作流适用于处理日常账单或发票,展示了小型本地语言模型在实际任务中的应用潜力。根据测试,它能正确处理约 75% 的样本发票,突出模型的实用性和改进空间。 关键技术和模型 · @ollama:用于在本地运行和管理语言模型的框架,支持高效的模型推理。 · uv:一个高效的 Python 包管理器,用于处理依赖和脚本执行,提高开发效率。 · LFM2-VL-3B:Liquid AI 的视觉语言模型,负责从发票图像中提取原始文本描述,包括 OCR 功能。 · LFM2-1.2B-Extract:另一个 Liquid AI 模型,专用于将非结构化文本转换为结构化数据记录,例如 JSON 格式的金额和货币字段。 这些模型均为小型(nano 级),可在普通硬件上运行,强调成本效益和本地部署。 代码结构和工作原理 代码主要位于 src/invoice_parser/main.py,采用模块化设计,便于扩展。工作流分为以下步骤: 1. 文件监控:工具持续监视指定的目录(如 invoices/),检测新添加的发票文件。 2. 文本提取:一旦检测到新文件,LFM2-VL-3B 模型会处理图像,生成原始文本描述(例如,识别出 “Total: $100 USD” 等内容)。 3. 信息结构化:将提取的文本传递给 LFM2-1.2B-Extract 模型,它使用提示工程将文本转换为结构化数据,如 {"amount": 100, "currency": "USD"}。 4. 数据存储:将结构化结果追加到目录中的 bills.csv 文件,确保数据持久化。 整个过程是链式的(chained),类似于智能体协作:视觉模型充当“眼睛”,提取模型充当“大脑”。如果处理现有文件,可以通过命令行参数启用。 开源地址:

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Mon Nov 10 00:38:00
RT @python_xxt: Be valuable, not available.

——分享一个接电话的习惯:

最近两年,我不再像以前那样,铃声响起,就快速接电话,对于非预期拨入的电话或语音,我大部分不会接,都是过十几分钟,或者更长一段时间,看情况再回复。

如果是真正…

RT @python_xxt: Be valuable, not available. ——分享一个接电话的习惯: 最近两年,我不再像以前那样,铃声响起,就快速接电话,对于非预期拨入的电话或语音,我大部分不会接,都是过十几分钟,或者更长一段时间,看情况再回复。 如果是真正…

从投资领域转到创业:找工作、找面试题、改简历、模拟面试. 创业(冷启动)|AI , AIGC | 安全技术|RAG | 时空智能 | 认知心理学|智能体 | 生命科学 | 强化学习 I built open source software at https://t.co/b69DXZhcyR

avatar for Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试
Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试
Mon Nov 10 00:34:31
RT @knowledgefxg: 这个蛮不错的呀,一个专为程序员设计的开源编程语言学习平台:https://t.co/g6ZSV3zceg
核心理念是通过对比不同编程语言的语法特性和概念映射,帮助你快速理解新语言的核心概念,目前支持学习 Python、Rust、Go、C++…

RT @knowledgefxg: 这个蛮不错的呀,一个专为程序员设计的开源编程语言学习平台:https://t.co/g6ZSV3zceg 核心理念是通过对比不同编程语言的语法特性和概念映射,帮助你快速理解新语言的核心概念,目前支持学习 Python、Rust、Go、C++…

从投资领域转到创业:找工作、找面试题、改简历、模拟面试. 创业(冷启动)|AI , AIGC | 安全技术|RAG | 时空智能 | 认知心理学|智能体 | 生命科学 | 强化学习 I built open source software at https://t.co/b69DXZhcyR

avatar for Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试
Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试
Mon Nov 10 00:34:09
Mole bro tech to me, if it’s real, won’t work in space. My theory is they are displacing *very* large volumes of air with electrohydrodynamic propulsion. You ionize a huge sphere around a craft and then push it. You can go extremely fast with minimal visual disturbance.

Mole bro tech to me, if it’s real, won’t work in space. My theory is they are displacing *very* large volumes of air with electrohydrodynamic propulsion. You ionize a huge sphere around a craft and then push it. You can go extremely fast with minimal visual disturbance.

Opening portals to handheld VR at https://t.co/A2JMItorCV. Problems soluble, potential to improve invariant.

avatar for gfodor.id
gfodor.id
Mon Nov 10 00:32:42
RT @ListenHub: Next Music Now Features Instrumental Music Mode! 🎸

Ideal for generating:
- Game BGM
- YouTube BGM
- Lofi beats for coding
-…

RT @ListenHub: Next Music Now Features Instrumental Music Mode! 🎸 Ideal for generating: - Game BGM - YouTube BGM - Lofi beats for coding -…

聊硅基 AI,看有机 Orange。

avatar for Orange AI
Orange AI
Mon Nov 10 00:31:25
  • Previous
  • 1
  • More pages
  • 298
  • 299
  • 300
  • More pages
  • 2111
  • Next