LogoThread Easy
  • 探索
  • 線程創作
LogoThread Easy

Twitter 線程的一站式夥伴

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

A Download Manager that speeds up your downloads.

A Download Manager that speeds up your downloads.

https://t.co/vh7nFwsdNX

avatar for GitHub Projects Community
GitHub Projects Community
Sat Nov 08 10:58:03
Great discussion on the past, present, and future of AI.

Great discussion on the past, present, and future of AI.

ceo @replit. civilizationist

avatar for Amjad Masad
Amjad Masad
Sat Nov 08 10:54:46
1993: 在互联网上,没人知道你是一条狗。
2025: 在互联网上,没人知道你是一个 LLM.

1993: 在互联网上,没人知道你是一条狗。 2025: 在互联网上,没人知道你是一个 LLM.

喜欢王小波,大概我们能成为朋友。 我的 2025 https://t.co/pAkSJnpKXA 我的 2024 https://t.co/HfDF6oduB7 我的 2023 https://t.co/QyV8PiZmOY ..............

avatar for yihong0618
yihong0618
Sat Nov 08 10:54:11
博客:https://t.co/YdZxB3gLdd

博客:https://t.co/YdZxB3gLdd

致力于让每个想拥抱AI的人都能找到适合自己的AI产品,助力企业定制AIGC应用

avatar for AIGCLINK
AIGCLINK
Sat Nov 08 10:48:32
谷歌发布机器学习新范式:Nested Learning嵌套学习,解决LLM在持续学习中的灾难性遗忘问题

核心思想,不要把模型当成一个整体来训练,它应该是一组‘嵌套’的小学习系统

即把模型视为多个嵌套的优化问题系统,每个子系统有自己的学习节奏和信息流,而不是一个统一的训练过程,从而增强LLM对长上下文的处理能力,实现持续学习

其用了一个自修改架构模型Hope来测试验证此套方法,结果比现有先进模型的长上下文记忆管理能力更好

语言建模和常识推理任务优于Titans、Samba和基线Transformer;长上下文管理能力优于Titans、TTT 、Mamba2

首先参数分层,同一权重矩阵按更新周期切成 W₁,W₂,…,Wₙ(周期 1,4,16,64…步)

然后连续记忆系统,把记忆看成一条“频谱”,不同模块负责不同时间长度的信息,避免学了就忘

深度优化器改进,将优化器视为关联记忆模块,改进其目标函数,提升抗噪性

训练代码只多一行“到时才更新”的判断,其余框架不变

谷歌发布机器学习新范式:Nested Learning嵌套学习,解决LLM在持续学习中的灾难性遗忘问题 核心思想,不要把模型当成一个整体来训练,它应该是一组‘嵌套’的小学习系统 即把模型视为多个嵌套的优化问题系统,每个子系统有自己的学习节奏和信息流,而不是一个统一的训练过程,从而增强LLM对长上下文的处理能力,实现持续学习 其用了一个自修改架构模型Hope来测试验证此套方法,结果比现有先进模型的长上下文记忆管理能力更好 语言建模和常识推理任务优于Titans、Samba和基线Transformer;长上下文管理能力优于Titans、TTT 、Mamba2 首先参数分层,同一权重矩阵按更新周期切成 W₁,W₂,…,Wₙ(周期 1,4,16,64…步) 然后连续记忆系统,把记忆看成一条“频谱”,不同模块负责不同时间长度的信息,避免学了就忘 深度优化器改进,将优化器视为关联记忆模块,改进其目标函数,提升抗噪性 训练代码只多一行“到时才更新”的判断,其余框架不变

博客:https://t.co/YdZxB3gLdd

avatar for AIGCLINK
AIGCLINK
Sat Nov 08 10:48:31
This Week in Laravel: 30+ Large Laravel Projects and DDD 
https://t.co/S9qUfh08iN 

My tradition of publishing weekly newsletter issue as a public article.

This Week in Laravel: 30+ Large Laravel Projects and DDD https://t.co/S9qUfh08iN My tradition of publishing weekly newsletter issue as a public article.

~20 yrs in web-dev, now mostly Laravel. My Laravel courses: https://t.co/HRUAJdMRZL My Youtube channel: https://t.co/qPQAkaov2F

avatar for Povilas Korop | Laravel Courses Creator & Youtuber
Povilas Korop | Laravel Courses Creator & Youtuber
Sat Nov 08 10:45:02
  • Previous
  • 1
  • More pages
  • 449
  • 450
  • 451
  • More pages
  • 2127
  • Next