LogoThread Easy
  • Explorar
  • Componer hilo
LogoThread Easy

Tu compañero integral para hilos de Twitter

© 2025 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

RT @TheRealStanLee: Happy first night of Hanukkah to all Marvelites who celebrate!

Many comicbook writers throughout history have been Jew…

RT @TheRealStanLee: Happy first night of Hanukkah to all Marvelites who celebrate! Many comicbook writers throughout history have been Jew…

Market Design/Entrepreneurship Professor @HarvardHBS & Faculty Affiliate @Harvard Economics; Research @a16zcrypto; Editor @restatjournal; Econ @Quora; … | #QED

avatar for Scott Kominers
Scott Kominers
Mon Dec 15 01:15:15
RT @FacciniMyriam: The lighting ceremony of the largest menorah in Europe in Kyiv in honor of the holiday of Hanukkah 🕎 https://t.co/brFUJi…

RT @FacciniMyriam: The lighting ceremony of the largest menorah in Europe in Kyiv in honor of the holiday of Hanukkah 🕎 https://t.co/brFUJi…

Market Design/Entrepreneurship Professor @HarvardHBS & Faculty Affiliate @Harvard Economics; Research @a16zcrypto; Editor @restatjournal; Econ @Quora; … | #QED

avatar for Scott Kominers
Scott Kominers
Mon Dec 15 01:14:44
It's not about costs of childbirth, it's about the next 18+ years
Absurd how female face-saving warps policy in every nation

It's not about costs of childbirth, it's about the next 18+ years Absurd how female face-saving warps policy in every nation

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Dec 15 01:14:14
[开源/书籍推荐] LLM-engineer-handbook 

有了 AI 模型,很多人都能在几分钟内写出一个 AI Demo,但要真正打造一个高性能、可扩展、安全的企业级应用,难度却呈指数级上升,这个项目就是为了解决这个问题而存在的,它是 @pauliusztin_ @maximelabonne 同名书籍对应的开源资源库,咱们一起看看 🔽

项目定位:从“玩具”到“工具”的桥梁
· 痛点解决:市面上的教程往往止步于“怎么跑通”,而该项目专注于“怎么用好”。它不仅告诉你有哪些工具,还整理了如何让模型在生产环境中稳定运行的最佳实践。
· 内容性质:它主要是一个精选资源列表,汇集了目前 AI 领域最前沿、最实用的框架、工具、教程和论文。

核心内容板块
该项目将庞大的 LLM 技术栈拆解为几个关键领域,结构非常清晰:
1. LLM 基础与训练
· 收录了从预训练到微调的主流框架(如 @huggingface,  @UnslothAI,  LitGPT 等)。
· 重点关注如何高效地训练模型,包括节省显存、加速训练的技巧。
2. 模型服务与部署
· 模型训练好了怎么跑?这里涵盖了各种推理引擎,关注高并发、低延迟的部署方案。
· 适合想要自己私有化部署模型的工程师参考。
3. 应用开发
· RAG:这是目前企业应用最火的方向。项目里整理了如何构建高质量知识库、向量数据库选型以及检索优化的资源。
· Agent:涵盖了如何构建能自主规划任务的 AI Agent,涉及 AdalFlow、DSPy 等前沿框架。
4. LLMOps
· 很多初学者容易忽略但至关重要的部分。涵盖了模型的监控、版本控制、评估以及如何管理 Prompt。
· 它强调了 AI 工程化的概念,而不仅仅是算法。
5. Prompt 优化
不仅仅是“写提示词”,更包括如何自动化地优化 Prompt,以及相关的自动调优工具。

为什么它很重要?
· 筛选过的知识:AI 领域发展太快,每天都有新工具。这个项目帮你做了“减法”,筛选出了经过社区验证的、更有价值的资源,节省了你的试错成本。
· 全栈视角:它不仅仅关注模型本身,而是关注整个生命周期(从数据准备 -> 训练/微调 -> 部署 -> 应用构建 -> 监控)。
· 实战导向:相比于学术论文列表,它更偏向于“工程师”视角,强调落地和实操。

开源地址

[开源/书籍推荐] LLM-engineer-handbook 有了 AI 模型,很多人都能在几分钟内写出一个 AI Demo,但要真正打造一个高性能、可扩展、安全的企业级应用,难度却呈指数级上升,这个项目就是为了解决这个问题而存在的,它是 @pauliusztin_ @maximelabonne 同名书籍对应的开源资源库,咱们一起看看 🔽 项目定位:从“玩具”到“工具”的桥梁 · 痛点解决:市面上的教程往往止步于“怎么跑通”,而该项目专注于“怎么用好”。它不仅告诉你有哪些工具,还整理了如何让模型在生产环境中稳定运行的最佳实践。 · 内容性质:它主要是一个精选资源列表,汇集了目前 AI 领域最前沿、最实用的框架、工具、教程和论文。 核心内容板块 该项目将庞大的 LLM 技术栈拆解为几个关键领域,结构非常清晰: 1. LLM 基础与训练 · 收录了从预训练到微调的主流框架(如 @huggingface, @UnslothAI, LitGPT 等)。 · 重点关注如何高效地训练模型,包括节省显存、加速训练的技巧。 2. 模型服务与部署 · 模型训练好了怎么跑?这里涵盖了各种推理引擎,关注高并发、低延迟的部署方案。 · 适合想要自己私有化部署模型的工程师参考。 3. 应用开发 · RAG:这是目前企业应用最火的方向。项目里整理了如何构建高质量知识库、向量数据库选型以及检索优化的资源。 · Agent:涵盖了如何构建能自主规划任务的 AI Agent,涉及 AdalFlow、DSPy 等前沿框架。 4. LLMOps · 很多初学者容易忽略但至关重要的部分。涵盖了模型的监控、版本控制、评估以及如何管理 Prompt。 · 它强调了 AI 工程化的概念,而不仅仅是算法。 5. Prompt 优化 不仅仅是“写提示词”,更包括如何自动化地优化 Prompt,以及相关的自动调优工具。 为什么它很重要? · 筛选过的知识:AI 领域发展太快,每天都有新工具。这个项目帮你做了“减法”,筛选出了经过社区验证的、更有价值的资源,节省了你的试错成本。 · 全栈视角:它不仅仅关注模型本身,而是关注整个生命周期(从数据准备 -> 训练/微调 -> 部署 -> 应用构建 -> 监控)。 · 实战导向:相比于学术论文列表,它更偏向于“工程师”视角,强调落地和实操。 开源地址

邵猛,中年失业程序员 😂 专注 - Context Engineering, AI Agents. 分享 - AI papers, apps and OSS. ex Microsoft MVP 合作 - 私信/邮箱:shaomeng@outlook.com 📢 公众号/小红书: AI 启蒙小伙伴

avatar for meng shao
meng shao
Mon Dec 15 01:10:01
Still a bit strange to see a fairly cool, imaginative new anime and realize «that's… not Japanese language…»

Still a bit strange to see a fairly cool, imaginative new anime and realize «that's… not Japanese language…»

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Mon Dec 15 01:04:56
NVIDIA 一个员工在上传要开源的 Nemotron-nano-3-30B-A3B 的时候, 一不小心把整个装有所有模型的文件夹都上传到了 HuggingFace, 包括:

EuroLLM-9B (欧盟资助的欧洲一些大学联合开发的开放权重模型, 应该只是下载下来学习或者参考)
NVIDIA-Nemotron-3-Nano-30B-A3B-BF16-new-chat-template (Nemotron-3-Nano 的chat模板)
NVIDIA-Nemotron-Nano-12B-v2 (NVIDIA 8月份开源的模型)
NVIDIA-Nemotron-Nano-31B-A3-v3 (一个内部版本, 之前没有放出)
NVIDIA-Nemotron-Nano-9B-v2-BF16 (NVIDIA 8月份开源的模型)
NVIDIA-Nemotron-Nano-9B-V2-EA (Early Access?)
NVIDIA-Nemotron-Nano-9B-v2-NGC (NVIDIA GPU Cloud 版本?)
NVIDIA-Nemotron-Nano-9B-v2-rc0807-safetensors (Release Candidate 发布候选版?)
NVIDIA-Nemotron-Nano-9B-v2-rc0807 (Release Candidate 发布候选版?)
NVIDIA-Nemotron-Nano-9B-v2.bak (备份?)
NVIDIA-Nemotron-Nano-9B-v2 (NVIDIA 8月份开源的模型)
Nemotron-H-4B-Base-8K (NVIDIA 去年开源的模型)
Nemotron-H-4B-Instruct-128K (NVIDIA 去年开源的模型)
Nemotron-H-8B-Base-8K (NVIDIA 去年开源的模型)
Nemotron-Nano-3-30B-A3.5B-dev-1016 (一个内部版本, 之前没有放出)
Nvidia-Nemotron-Nano-v2-9B-0805 (一个内部版本, 之前没有放出)
Qwen3-14B (千问哈哈哈哈哈, 估计也是用来研究?)
Qwen3-8B (千问)
llama-3.1-nemoguard-8b-content-safety (NVIDIA 几个月前开源的模型)
nano-12b-v2-finalcheckpoint (一个内部checkpoint版本, 之前没有放出)

目前来看应该没太大的损失, 只是中间检查点和一些内部版本被泄露了, 另外看起来应该 NVIDIA-Nemotron-Nano 是有 31B-A3B 或 30B-A3.5B 的版本没开源的. 估计是效果不理想?

NVIDIA 一个员工在上传要开源的 Nemotron-nano-3-30B-A3B 的时候, 一不小心把整个装有所有模型的文件夹都上传到了 HuggingFace, 包括: EuroLLM-9B (欧盟资助的欧洲一些大学联合开发的开放权重模型, 应该只是下载下来学习或者参考) NVIDIA-Nemotron-3-Nano-30B-A3B-BF16-new-chat-template (Nemotron-3-Nano 的chat模板) NVIDIA-Nemotron-Nano-12B-v2 (NVIDIA 8月份开源的模型) NVIDIA-Nemotron-Nano-31B-A3-v3 (一个内部版本, 之前没有放出) NVIDIA-Nemotron-Nano-9B-v2-BF16 (NVIDIA 8月份开源的模型) NVIDIA-Nemotron-Nano-9B-V2-EA (Early Access?) NVIDIA-Nemotron-Nano-9B-v2-NGC (NVIDIA GPU Cloud 版本?) NVIDIA-Nemotron-Nano-9B-v2-rc0807-safetensors (Release Candidate 发布候选版?) NVIDIA-Nemotron-Nano-9B-v2-rc0807 (Release Candidate 发布候选版?) NVIDIA-Nemotron-Nano-9B-v2.bak (备份?) NVIDIA-Nemotron-Nano-9B-v2 (NVIDIA 8月份开源的模型) Nemotron-H-4B-Base-8K (NVIDIA 去年开源的模型) Nemotron-H-4B-Instruct-128K (NVIDIA 去年开源的模型) Nemotron-H-8B-Base-8K (NVIDIA 去年开源的模型) Nemotron-Nano-3-30B-A3.5B-dev-1016 (一个内部版本, 之前没有放出) Nvidia-Nemotron-Nano-v2-9B-0805 (一个内部版本, 之前没有放出) Qwen3-14B (千问哈哈哈哈哈, 估计也是用来研究?) Qwen3-8B (千问) llama-3.1-nemoguard-8b-content-safety (NVIDIA 几个月前开源的模型) nano-12b-v2-finalcheckpoint (一个内部checkpoint版本, 之前没有放出) 目前来看应该没太大的损失, 只是中间检查点和一些内部版本被泄露了, 另外看起来应该 NVIDIA-Nemotron-Nano 是有 31B-A3B 或 30B-A3.5B 的版本没开源的. 估计是效果不理想?

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.

avatar for karminski-牙医
karminski-牙医
Mon Dec 15 01:01:23
  • Previous
  • 1
  • More pages
  • 750
  • 751
  • 752
  • More pages
  • 5634
  • Next