LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

想深入了解 ChatGPT、Claude 这些 AI 背后的训练机制,尤其是它们背后那套如何通过人类反馈变得越来越智能的原理。

可以看下,来自加州大学数学系教授 Ernest K. Ryu 开设的《大语言模型的强化学习》课程,配套 PPT 和视频可以免费学习。

课程从深度强化学习基础讲起,逐步深入到 Transformer 架构和现代 LLM 技术,最后聚焦于 RLHF(人类反馈强化学习)等前沿训练方法,系统讲解了如何让 AI 模型变得更智能、更符合人类偏好。

课程地址:https://t.co/hKwoSkITJG

主要内容:

- 深度强化学习基础:MDP 理论、策略梯度方法(A3C、PPO)等核心算法;
- 大语言模型架构:从 RNN 到 Transformer,涵盖 BERT、GPT 等经典模型;
- LLM 强化学习训练:详解 RLHF、DPO 等让模型遵循人类指令的技术;
- AlphaGo 原理和专家迭代:学习如何提升模型的推理能力。

课程要求大家需要具备一定深度学习基础,提供视频教学和 Jupyter 代码示例可直接运行,理论与实践结合。

想深入了解 ChatGPT、Claude 这些 AI 背后的训练机制,尤其是它们背后那套如何通过人类反馈变得越来越智能的原理。 可以看下,来自加州大学数学系教授 Ernest K. Ryu 开设的《大语言模型的强化学习》课程,配套 PPT 和视频可以免费学习。 课程从深度强化学习基础讲起,逐步深入到 Transformer 架构和现代 LLM 技术,最后聚焦于 RLHF(人类反馈强化学习)等前沿训练方法,系统讲解了如何让 AI 模型变得更智能、更符合人类偏好。 课程地址:https://t.co/hKwoSkITJG 主要内容: - 深度强化学习基础:MDP 理论、策略梯度方法(A3C、PPO)等核心算法; - 大语言模型架构:从 RNN 到 Transformer,涵盖 BERT、GPT 等经典模型; - LLM 强化学习训练:详解 RLHF、DPO 等让模型遵循人类指令的技术; - AlphaGo 原理和专家迭代:学习如何提升模型的推理能力。 课程要求大家需要具备一定深度学习基础,提供视频教学和 Jupyter 代码示例可直接运行,理论与实践结合。

💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily

avatar for GitHubDaily
GitHubDaily
Fri Oct 31 04:00:00
AI从日记中总结提炼的内容,质量还挺棒的。

AI从日记中总结提炼的内容,质量还挺棒的。

喜欢摇滚乐、爱钓鱼的PM 网站:https://t.co/vnUpLt752o

avatar for 向阳乔木
向阳乔木
Fri Oct 31 03:59:52
No sense of aesthetics, no theory of mind, probably no appreciation for hate sex either. «Rational actor».
perhaps that's what it takes to be a Hajnali Sinophile. A perplexing existence, but valid in its own queer way!

No sense of aesthetics, no theory of mind, probably no appreciation for hate sex either. «Rational actor». perhaps that's what it takes to be a Hajnali Sinophile. A perplexing existence, but valid in its own queer way!

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Fri Oct 31 03:59:50
https://t.co/UbLzPP43Ra

https://t.co/UbLzPP43Ra

I built a Cursor-like experience plugin for Neovim: avante.nvim

avatar for yetone
yetone
Fri Oct 31 03:57:27
话说最近原子朋克(Atompunk)的复兴有点看腻了,好几年前我特别喜欢 Atompunk,自己的所有开源项目的演示视频都是 Atompunk 风格的,甚至为了统一这些开源项目的 badges 风格还写过一个 atompunk-badge 项目

现代人需要搞一些 Mythpunk、Clockpunk、Liminalpunk 来当代餐了

话说最近原子朋克(Atompunk)的复兴有点看腻了,好几年前我特别喜欢 Atompunk,自己的所有开源项目的演示视频都是 Atompunk 风格的,甚至为了统一这些开源项目的 badges 风格还写过一个 atompunk-badge 项目 现代人需要搞一些 Mythpunk、Clockpunk、Liminalpunk 来当代餐了

https://t.co/UbLzPP43Ra

avatar for yetone
yetone
Fri Oct 31 03:57:26
New indie hacking project 🚀 🧱

New indie hacking project 🚀 🧱

Founder, building productivity AI 🔊 https://t.co/pRVZEDeUxO $3K ✦ 🎥 Figma Plugin $10k/MRR (sold) ✦ 🕵🏻 Agency $30k/MRR (sunset)

avatar for Michael Yagudaev 🧑🏻‍💻🇨🇦
Michael Yagudaev 🧑🏻‍💻🇨🇦
Fri Oct 31 03:57:15
  • Previous
  • 1
  • More pages
  • 1617
  • 1618
  • 1619
  • More pages
  • 2111
  • Next