LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

结论

结论

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.

avatar for karminski-牙医
karminski-牙医
Thu Nov 06 09:48:30
验证原理

验证原理

结论

avatar for karminski-牙医
karminski-牙医
Thu Nov 06 09:48:30
石锤! Windsurf 的新模型 SWE-1.5 更像 GLM-4.5!

之前网传硅谷的公司已经在内部开始大面积用国产开放权重大模型来魔改了, 传的尤其猛的是 Cursor 的 Composer-1 是用 DeepSeek 魔改(后训练或微调)的, 而 Windsurf 的 SWE-1.5 是用 GLM-4.6 魔改的.

而上一个基本已经石锤了, 这个还没有被验证, 于是给大家整个活, 看看这个模型从输出特征进行聚类, 更像哪个模型.

我魔改了 Slop-Forensics 分析了 SWE-1.5 和其它国产大模型的语言指纹, 结果出乎意料:

它与 GLM-4.5 聚类在同一分支,而非之前网传的 GLM-4.6!

考虑到一个模型想要效果好, 即使用其他的基座模型也要后训练一段时间, 所以的确更可能是 GLM-4.5 (7月28号发布), 而不是 GLM-4.6 (10月1号发布).

可惜了它没用 GLM-4.6 后训练哈哈哈, 我觉得以目前 GLM-4.6 作为基座模型后训练会比现在更猛, 或者是不是这样? SWE-1.5 对应 GLM-4.5, SWE-1.6 对应 GLM-4.6?

另外, Cerebras (即 Windsurf 这个 SWE-1.5 模型的云计算服务商), 决定将 GLM-4.6 作为默认推荐模型, 考虑到 GLM-4.6 在测试上的表现 (SWE-Bench 68%, LiveCodeBenchV6 82.8%), 我估计下一个模型用GLM-4.6概率就特别大了.

国产大模型牛皮!

顺便讲一下 Slop-Forensics 这个项目的原理:
• 统计每个模型的词汇使用频率和短语重复模式
• 将这些"语言习惯"转化为特征向量
• 用聚类算法构建系统发育树,距离近=语言模式相似

就像指纹鉴定,不同模型即使输出相同内容,其底层的词汇偏好、短语组合方式会暴露出训练数据或架构的相似性.

SWE-1.5 和 GLM-4.5 在树上紧密聚类,说明它们在:
高频词选择
二元/三元短语组合
词汇复杂度分布
这些维度上高度一致。这种相似性很难伪造——它根植于模型的深层结构中.

我魔改的版本:https://t.co/s5h62S9apS

#智谱 #GLM #Cursor #windsurf #cerebras #国产大模型 #AI编程

石锤! Windsurf 的新模型 SWE-1.5 更像 GLM-4.5! 之前网传硅谷的公司已经在内部开始大面积用国产开放权重大模型来魔改了, 传的尤其猛的是 Cursor 的 Composer-1 是用 DeepSeek 魔改(后训练或微调)的, 而 Windsurf 的 SWE-1.5 是用 GLM-4.6 魔改的. 而上一个基本已经石锤了, 这个还没有被验证, 于是给大家整个活, 看看这个模型从输出特征进行聚类, 更像哪个模型. 我魔改了 Slop-Forensics 分析了 SWE-1.5 和其它国产大模型的语言指纹, 结果出乎意料: 它与 GLM-4.5 聚类在同一分支,而非之前网传的 GLM-4.6! 考虑到一个模型想要效果好, 即使用其他的基座模型也要后训练一段时间, 所以的确更可能是 GLM-4.5 (7月28号发布), 而不是 GLM-4.6 (10月1号发布). 可惜了它没用 GLM-4.6 后训练哈哈哈, 我觉得以目前 GLM-4.6 作为基座模型后训练会比现在更猛, 或者是不是这样? SWE-1.5 对应 GLM-4.5, SWE-1.6 对应 GLM-4.6? 另外, Cerebras (即 Windsurf 这个 SWE-1.5 模型的云计算服务商), 决定将 GLM-4.6 作为默认推荐模型, 考虑到 GLM-4.6 在测试上的表现 (SWE-Bench 68%, LiveCodeBenchV6 82.8%), 我估计下一个模型用GLM-4.6概率就特别大了. 国产大模型牛皮! 顺便讲一下 Slop-Forensics 这个项目的原理: • 统计每个模型的词汇使用频率和短语重复模式 • 将这些"语言习惯"转化为特征向量 • 用聚类算法构建系统发育树,距离近=语言模式相似 就像指纹鉴定,不同模型即使输出相同内容,其底层的词汇偏好、短语组合方式会暴露出训练数据或架构的相似性. SWE-1.5 和 GLM-4.5 在树上紧密聚类,说明它们在: 高频词选择 二元/三元短语组合 词汇复杂度分布 这些维度上高度一致。这种相似性很难伪造——它根植于模型的深层结构中. 我魔改的版本:https://t.co/s5h62S9apS #智谱 #GLM #Cursor #windsurf #cerebras #国产大模型 #AI编程

我是怎么验证的

avatar for karminski-牙医
karminski-牙医
Thu Nov 06 09:48:28
卧槽 铁甲钢拳成真...

宇树科技发布:Embodied Avatar 机器人实体分身

这是一个融合 全身动作捕捉、远程控制与虚拟交互 的创新系统

让你可以实时控制属于你的“虚拟化身机器人”
你做什么动作 机器人就做什么动作...

他们上线了一个全身远程操控与全身动作数据采集平台

👉 全身动作采集
👉 实时远程控制
👉 体验真正的具身化交互

卧槽 铁甲钢拳成真... 宇树科技发布:Embodied Avatar 机器人实体分身 这是一个融合 全身动作捕捉、远程控制与虚拟交互 的创新系统 让你可以实时控制属于你的“虚拟化身机器人” 你做什么动作 机器人就做什么动作... 他们上线了一个全身远程操控与全身动作数据采集平台 👉 全身动作采集 👉 实时远程控制 👉 体验真正的具身化交互

再来重温下 铁甲钢拳 片段...

avatar for 小互
小互
Thu Nov 06 09:44:41
再来重温下 

铁甲钢拳 片段...

再来重温下 铁甲钢拳 片段...

学AI找小互,找小互,上 https://t.co/4PVaHEr5r3 ...

avatar for 小互
小互
Thu Nov 06 09:44:41
RT @ekuyda: Today, we’re thrilled to announce $20M in funding led by @a16z, with support from @saranormous, @amasad, @akothari, @garrytan,…

RT @ekuyda: Today, we’re thrilled to announce $20M in funding led by @a16z, with support from @saranormous, @amasad, @akothari, @garrytan,…

ceo @replit. civilizationist

avatar for Amjad Masad
Amjad Masad
Thu Nov 06 09:43:54
  • Previous
  • 1
  • More pages
  • 739
  • 740
  • 741
  • More pages
  • 2127
  • Next