开启时会模糊预览图,关闭后正常显示

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.


最后是知识量测试, 给 GLM-4.6V 一个万用表图片, 问大模型该如何测试电池的电量, 这个也是没问题, 这也是 GLM-4.6V 的另一大优势, 参数量足够所以知识量特别好, 之前在 GLM-4.5V 测试的时候, 它连麻将胡牌都能判断出来. 总结: 相比于 几个月前的 GLM-4.5V 这次不但性能继续有提升, 可以完成之前无法完成的测试, 而且增加了 Agent/ MCP 能力, 可以用工具完成任务了, 极大的拓宽了模型的应用场景. 不过测试中对于复杂场景还需要继续打磨, 期待下一个版本的更新! 另外, 智谱也把GLM-4.6V 加入了 GLM Coding Plan, 定价也比 GLM-4.5V 便宜了一半, 多模态编程任务也可以爽用了! #GLM #GLM46V #智谱AI #VLM


然后是动态网站录屏生成动态网站测试, 同样这个测试中 OCR 能力非常不错, 网页中的文本都可以还原, 但是文本的动效是没办法还原的, 估计需要针对性训练. 接下来是对象标记测试, 一个有长颈鹿和羚羊的图片, 这个图是我精心挑选的,干扰项很多, 比如右侧的长颈鹿, 两个脖子几乎重叠, 很容易误判, 以及下面的2只羚羊被长颈鹿遮挡, 但还是头尾相接的, 如果模型不能理解哺乳动物身体结构, 就容易误判. 在这个测试中, 长颈鹿完美识别, 但是挡住的羚羊少算了一只. 跟之前的 GLM-4.5V 对比还是有进步的, 之前的测试这个是没办法完成的. 然后是网站还原测试, 不过写传统网站相信大家看腻了, 于是这次增大了测试难度, 直接使用了化学实验的图片, 让 GLM-4.6V 使用 three.js 进行建模模拟化学实验. 可以看到电解水试验完成得不错, 除了电池以外其他部分均还原良好. 然后是复杂的场景, 加热生成氧气. 这个的细节是, 所有的试验仪器都还原了, 但是空间位置不对, 不过这个对于头部大模型都是足够困难的测试. 情有可原.


https://t.co/VeeOT2u96G


Teach AI for Science on https://t.co/EjMt9Lde9B Youtube: https://t.co/OofaON17z1 Substack: https://t.co/IIleagZfwW 知识星球:https://t.co/kyzMiDmFWb


🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF
