LogoThread Easy
  • 探索
  • 撰写 Thread
LogoThread Easy

您的一体化 Twitter 线程助手

© 2025 Thread Easy All Rights Reserved.

探索

最新在前,按卡片方式浏览线程

开启时会模糊预览图,关闭后正常显示

RT @zhil_arf: Sovereign is the architect of the fabrics of reality.

RT @zhil_arf: Sovereign is the architect of the fabrics of reality.

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Fri Oct 31 04:06:49
RT @zhil_arf: Through the financial system. You need to work to get dollars to buy food, housing, amenities, entertainment, and lifestyle.…

RT @zhil_arf: Through the financial system. You need to work to get dollars to buy food, housing, amenities, entertainment, and lifestyle.…

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Fri Oct 31 04:06:33
你的朋友取得了成功,你却不为他感到高兴。

你就不是一个合格的朋友。

你的朋友取得了成功,你却不为他感到高兴。 你就不是一个合格的朋友。

全栈创业者: - https://t.co/MNlf5lc1G3 - https://t.co/KZEK3kuwNU - https://t.co/0ilSrNfWRI 主打陪伴的出海陪跑师:@chuhaiqu 发行了 4 张专辑的 AI 音乐练习生:@LuoSuno

avatar for Luo说不啰嗦
Luo说不啰嗦
Fri Oct 31 04:00:06
想深入了解 ChatGPT、Claude 这些 AI 背后的训练机制,尤其是它们背后那套如何通过人类反馈变得越来越智能的原理。

可以看下,来自加州大学数学系教授 Ernest K. Ryu 开设的《大语言模型的强化学习》课程,配套 PPT 和视频可以免费学习。

课程从深度强化学习基础讲起,逐步深入到 Transformer 架构和现代 LLM 技术,最后聚焦于 RLHF(人类反馈强化学习)等前沿训练方法,系统讲解了如何让 AI 模型变得更智能、更符合人类偏好。

课程地址:https://t.co/hKwoSkITJG

主要内容:

- 深度强化学习基础:MDP 理论、策略梯度方法(A3C、PPO)等核心算法;
- 大语言模型架构:从 RNN 到 Transformer,涵盖 BERT、GPT 等经典模型;
- LLM 强化学习训练:详解 RLHF、DPO 等让模型遵循人类指令的技术;
- AlphaGo 原理和专家迭代:学习如何提升模型的推理能力。

课程要求大家需要具备一定深度学习基础,提供视频教学和 Jupyter 代码示例可直接运行,理论与实践结合。

想深入了解 ChatGPT、Claude 这些 AI 背后的训练机制,尤其是它们背后那套如何通过人类反馈变得越来越智能的原理。 可以看下,来自加州大学数学系教授 Ernest K. Ryu 开设的《大语言模型的强化学习》课程,配套 PPT 和视频可以免费学习。 课程从深度强化学习基础讲起,逐步深入到 Transformer 架构和现代 LLM 技术,最后聚焦于 RLHF(人类反馈强化学习)等前沿训练方法,系统讲解了如何让 AI 模型变得更智能、更符合人类偏好。 课程地址:https://t.co/hKwoSkITJG 主要内容: - 深度强化学习基础:MDP 理论、策略梯度方法(A3C、PPO)等核心算法; - 大语言模型架构:从 RNN 到 Transformer,涵盖 BERT、GPT 等经典模型; - LLM 强化学习训练:详解 RLHF、DPO 等让模型遵循人类指令的技术; - AlphaGo 原理和专家迭代:学习如何提升模型的推理能力。 课程要求大家需要具备一定深度学习基础,提供视频教学和 Jupyter 代码示例可直接运行,理论与实践结合。

💡 挖掘开源的价值 🧑🏻‍💻 坚持分享 GitHub 上高质量、有趣、实用的教程、AI工具、前沿 AI 技术 🧐 A list cool, interesting projects of GitHub. ✏️ 公众号:GitHubDaily

avatar for GitHubDaily
GitHubDaily
Fri Oct 31 04:00:00
AI从日记中总结提炼的内容,质量还挺棒的。

AI从日记中总结提炼的内容,质量还挺棒的。

喜欢摇滚乐、爱钓鱼的PM 网站:https://t.co/vnUpLt752o

avatar for 向阳乔木
向阳乔木
Fri Oct 31 03:59:52
No sense of aesthetics, no theory of mind, probably no appreciation for hate sex either. «Rational actor».
perhaps that's what it takes to be a Hajnali Sinophile. A perplexing existence, but valid in its own queer way!

No sense of aesthetics, no theory of mind, probably no appreciation for hate sex either. «Rational actor». perhaps that's what it takes to be a Hajnali Sinophile. A perplexing existence, but valid in its own queer way!

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Fri Oct 31 03:59:50
  • Previous
  • 1
  • More pages
  • 1632
  • 1633
  • 1634
  • More pages
  • 2127
  • Next