LogoThread Easy
  • Explorar
  • Criar thread
LogoThread Easy

Seu parceiro completo para threads do Twitter

© 2025 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

RT @razvanilin: Full house at Hackumvit today 🔥

We even had a huge screen for demos today 😄

RT @razvanilin: Full house at Hackumvit today 🔥 We even had a huge screen for demos today 😄

⚡ Founder and 🌊 Surfer sharing lessons bootstrapping SaaS. ✍️ Notion Docs ➯ Help Center @HelpkitHQ 💰 Get Customers With Reddit ➯ https://t.co/sCWi6vTA7m

avatar for Dominik Sobe ツ
Dominik Sobe ツ
Fri Nov 07 04:01:55
Superior Persian aesthetic tradition, simple as
some things are not just about economics
man I want saffron rice

Superior Persian aesthetic tradition, simple as some things are not just about economics man I want saffron rice

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Fri Nov 07 04:01:44
Youware 出了个积分保护的功能,这个不错

如果你觉得 AI 生成的内容有问题需要回退,在你回退的时候消耗的积分也会返还到你的账号

不用担心 AI 写错,你还得花钱了

Youware 出了个积分保护的功能,这个不错 如果你觉得 AI 生成的内容有问题需要回退,在你回退的时候消耗的积分也会返还到你的账号 不用担心 AI 写错,你还得花钱了

关注人工智能、LLM 、 AI 图像视频和设计(Interested in AI, LLM, Stable Diffusion, and design) AIGC 周刊主理人|公众号:歸藏的AI工具箱

avatar for 歸藏(guizang.ai)
歸藏(guizang.ai)
Fri Nov 07 04:00:35
在众多大语言模型选择当中,如何评估一个大模型在具体任务上的表现,成为了我们一大难题。

刚好看到,Hugging Face 开源了一份《LLM 评估指南》,系统地解答了我们在 LLM 评估中的各种困惑。

涵涵盖了自动化基准测试、人工评估、LLM-as-a-judge 三大主流评估方法,还提供了丰富的实践经验、故障排查技巧,以及如何设计适合自己需求的评估方案。

GitHub:https://t.co/L4LjSmvDtN

主要内容:

- 自动化基准测试:包括基础知识、评估设计、数据集推荐和实用技巧;
- 人工评估:涵盖基础概念、如何使用人工标注员及实践经验;
- LLM-as-a-judge:从获取评判模型到设计提示词,再到评估评估器本身;
- 故障排查:针对推理和可复现性问题的实用解决方案;
- 通用知识:模型推理、分词等 LLM 基础概念的入门讲解;
- 年度深度分析:2023-2025 年关于开源、评估目的和实用性的思考。

内容按难度分层,初学者可从 “基础” 部分入门,进阶朋友可直接查看 “技巧” 或 “故障排查” 章节,另外还提供了中文和法语社区翻译版本。

在众多大语言模型选择当中,如何评估一个大模型在具体任务上的表现,成为了我们一大难题。 刚好看到,Hugging Face 开源了一份《LLM 评估指南》,系统地解答了我们在 LLM 评估中的各种困惑。 涵涵盖了自动化基准测试、人工评估、LLM-as-a-judge 三大主流评估方法,还提供了丰富的实践经验、故障排查技巧,以及如何设计适合自己需求的评估方案。 GitHub:https://t.co/L4LjSmvDtN 主要内容: - 自动化基准测试:包括基础知识、评估设计、数据集推荐和实用技巧; - 人工评估:涵盖基础概念、如何使用人工标注员及实践经验; - LLM-as-a-judge:从获取评判模型到设计提示词,再到评估评估器本身; - 故障排查:针对推理和可复现性问题的实用解决方案; - 通用知识:模型推理、分词等 LLM 基础概念的入门讲解; - 年度深度分析:2023-2025 年关于开源、评估目的和实用性的思考。 内容按难度分层,初学者可从 “基础” 部分入门,进阶朋友可直接查看 “技巧” 或 “故障排查” 章节,另外还提供了中文和法语社区翻译版本。

💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily

avatar for GitHubDaily
GitHubDaily
Fri Nov 07 04:00:09
NOFX 持续亏损中,调整下提示词,再跑 24 小时,还是亏的话就先暂停了

NOFX 持续亏损中,调整下提示词,再跑 24 小时,还是亏的话就先暂停了

前端切图仔🧑🏻‍💻,后端三脚猫🤷🏻‍♂️,运维挖坑人🤦🏻‍♂️,AI 门外汉🧐。 开源: ⚡ https://t.co/wk0K4h9gd5 玩具: 📮 https://t.co/VTi1aFKE2y 🧰 https://t.co/cRxrFndEFH 我在使用的工具: 🛠:https://t.co/47QLYWyxJA

avatar for 面条
面条
Fri Nov 07 03:56:27
有没有模型或云服务厂商合作一个商单,哈哈哈 整活!

有没有模型或云服务厂商合作一个商单,哈哈哈 整活!

🚧 building https://t.co/AJfZ3LMlgq https://t.co/SSdYgVYZsz https://t.co/s0m0tpQMDH https://t.co/Z3WryKZr0l 🐣learning/earning while helping others ❤️making software, storytelling videos 🔙alibaba @thoughtworks

avatar for 吕立青_JimmyLv (🐣, 🐣) 2𐃏25 | building bibigpt.co
吕立青_JimmyLv (🐣, 🐣) 2𐃏25 | building bibigpt.co
Fri Nov 07 03:55:53
  • Previous
  • 1
  • More pages
  • 605
  • 606
  • 607
  • More pages
  • 2111
  • Next