LogoThread Easy
  • 発見
  • スレッド作成
LogoThread Easy

Twitter スレッドの万能パートナー

© 2025 Thread Easy All Rights Reserved.

探索

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

最后是知识量测试, 给 GLM-4.6V 一个万用表图片, 问大模型该如何测试电池的电量, 这个也是没问题, 这也是 GLM-4.6V 的另一大优势, 参数量足够所以知识量特别好, 之前在 GLM-4.5V 测试的时候, 它连麻将胡牌都能判断出来.

总结: 相比于 几个月前的 GLM-4.5V 这次不但性能继续有提升, 可以完成之前无法完成的测试, 而且增加了 Agent/ MCP 能力, 可以用工具完成任务了, 极大的拓宽了模型的应用场景. 不过测试中对于复杂场景还需要继续打磨, 期待下一个版本的更新!

另外, 智谱也把GLM-4.6V 加入了 GLM Coding Plan, 定价也比 GLM-4.5V 便宜了一半, 多模态编程任务也可以爽用了!

#GLM #GLM46V #智谱AI #VLM

最后是知识量测试, 给 GLM-4.6V 一个万用表图片, 问大模型该如何测试电池的电量, 这个也是没问题, 这也是 GLM-4.6V 的另一大优势, 参数量足够所以知识量特别好, 之前在 GLM-4.5V 测试的时候, 它连麻将胡牌都能判断出来. 总结: 相比于 几个月前的 GLM-4.5V 这次不但性能继续有提升, 可以完成之前无法完成的测试, 而且增加了 Agent/ MCP 能力, 可以用工具完成任务了, 极大的拓宽了模型的应用场景. 不过测试中对于复杂场景还需要继续打磨, 期待下一个版本的更新! 另外, 智谱也把GLM-4.6V 加入了 GLM Coding Plan, 定价也比 GLM-4.5V 便宜了一半, 多模态编程任务也可以爽用了! #GLM #GLM46V #智谱AI #VLM

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.

avatar for karminski-牙医
karminski-牙医
Tue Dec 09 07:31:14
然后是动态网站录屏生成动态网站测试, 同样这个测试中 OCR 能力非常不错, 网页中的文本都可以还原, 但是文本的动效是没办法还原的, 估计需要针对性训练.

接下来是对象标记测试, 一个有长颈鹿和羚羊的图片, 这个图是我精心挑选的,干扰项很多, 比如右侧的长颈鹿, 两个脖子几乎重叠, 很容易误判, 以及下面的2只羚羊被长颈鹿遮挡, 但还是头尾相接的, 如果模型不能理解哺乳动物身体结构, 就容易误判. 在这个测试中, 长颈鹿完美识别, 但是挡住的羚羊少算了一只. 跟之前的 GLM-4.5V 对比还是有进步的, 之前的测试这个是没办法完成的.

然后是网站还原测试, 不过写传统网站相信大家看腻了, 于是这次增大了测试难度, 直接使用了化学实验的图片, 让 GLM-4.6V 使用 three.js 进行建模模拟化学实验. 可以看到电解水试验完成得不错, 除了电池以外其他部分均还原良好. 然后是复杂的场景, 加热生成氧气. 这个的细节是, 所有的试验仪器都还原了, 但是空间位置不对, 不过这个对于头部大模型都是足够困难的测试. 情有可原.

然后是动态网站录屏生成动态网站测试, 同样这个测试中 OCR 能力非常不错, 网页中的文本都可以还原, 但是文本的动效是没办法还原的, 估计需要针对性训练. 接下来是对象标记测试, 一个有长颈鹿和羚羊的图片, 这个图是我精心挑选的,干扰项很多, 比如右侧的长颈鹿, 两个脖子几乎重叠, 很容易误判, 以及下面的2只羚羊被长颈鹿遮挡, 但还是头尾相接的, 如果模型不能理解哺乳动物身体结构, 就容易误判. 在这个测试中, 长颈鹿完美识别, 但是挡住的羚羊少算了一只. 跟之前的 GLM-4.5V 对比还是有进步的, 之前的测试这个是没办法完成的. 然后是网站还原测试, 不过写传统网站相信大家看腻了, 于是这次增大了测试难度, 直接使用了化学实验的图片, 让 GLM-4.6V 使用 three.js 进行建模模拟化学实验. 可以看到电解水试验完成得不错, 除了电池以外其他部分均还原良好. 然后是复杂的场景, 加热生成氧气. 这个的细节是, 所有的试验仪器都还原了, 但是空间位置不对, 不过这个对于头部大模型都是足够困难的测试. 情有可原.

最后是知识量测试, 给 GLM-4.6V 一个万用表图片, 问大模型该如何测试电池的电量, 这个也是没问题, 这也是 GLM-4.6V 的另一大优势, 参数量足够所以知识量特别好, 之前在 GLM-4.5V 测试的时候, 它连麻将胡牌都能判断出来. 总结: 相比于 几个月前的 GLM-4.5V 这次不但性能继续有提升, 可以完成之前无法完成的测试, 而且增加了 Agent/ MCP 能力, 可以用工具完成任务了, 极大的拓宽了模型的应用场景. 不过测试中对于复杂场景还需要继续打磨, 期待下一个版本的更新! 另外, 智谱也把GLM-4.6V 加入了 GLM Coding Plan, 定价也比 GLM-4.5V 便宜了一半, 多模态编程任务也可以爽用了! #GLM #GLM46V #智谱AI #VLM

avatar for karminski-牙医
karminski-牙医
Tue Dec 09 07:31:13
GLM-4.6V 实测! 会用 ToolCall 的大模型能做些什么?

给大家带来 GLM-4.6V 实测! 由于 GLM-4.6V 支持 Agent/MCP 能力, 所以我们扩展了测试场景, 包括使用PDF撰写图文文案, 使用网站录屏视频还原网站, 识别外卖小票等. 

直接来看测试结果:

首先是外卖小票测试, 上传多张外卖小票, 让模型统计都吃了什么, 花了多少钱, 并且梳理可能的过敏原. 这个测试完美通过, 而在接下来的测试中, GLM-4.6V 的 OCR 能力也是最突出的能力, 所以OCR场景使用是完全没问题的.

然后是本次新更新的 PDF 视觉报告 Agent 测试, 即上传一个 PDF, 模型可以调用截图Agent, 然后总结 PDF 内容, 并且配上截图生成内容丰富的文案. 这个测试中, AI 在处理简单布局的 PDF 是没问题的, 可以顺利把里面的图片截取出来. 但是复杂排版的PDF, 比如我测试中的这个制作模型的杂志PDF, 它只是把整页PDF当作图片输出了, 而不是截取每个小图.

#GLM #GLM46V #智谱AI #VLM #智谱

GLM-4.6V 实测! 会用 ToolCall 的大模型能做些什么? 给大家带来 GLM-4.6V 实测! 由于 GLM-4.6V 支持 Agent/MCP 能力, 所以我们扩展了测试场景, 包括使用PDF撰写图文文案, 使用网站录屏视频还原网站, 识别外卖小票等. 直接来看测试结果: 首先是外卖小票测试, 上传多张外卖小票, 让模型统计都吃了什么, 花了多少钱, 并且梳理可能的过敏原. 这个测试完美通过, 而在接下来的测试中, GLM-4.6V 的 OCR 能力也是最突出的能力, 所以OCR场景使用是完全没问题的. 然后是本次新更新的 PDF 视觉报告 Agent 测试, 即上传一个 PDF, 模型可以调用截图Agent, 然后总结 PDF 内容, 并且配上截图生成内容丰富的文案. 这个测试中, AI 在处理简单布局的 PDF 是没问题的, 可以顺利把里面的图片截取出来. 但是复杂排版的PDF, 比如我测试中的这个制作模型的杂志PDF, 它只是把整页PDF当作图片输出了, 而不是截取每个小图. #GLM #GLM46V #智谱AI #VLM #智谱

然后是动态网站录屏生成动态网站测试, 同样这个测试中 OCR 能力非常不错, 网页中的文本都可以还原, 但是文本的动效是没办法还原的, 估计需要针对性训练. 接下来是对象标记测试, 一个有长颈鹿和羚羊的图片, 这个图是我精心挑选的,干扰项很多, 比如右侧的长颈鹿, 两个脖子几乎重叠, 很容易误判, 以及下面的2只羚羊被长颈鹿遮挡, 但还是头尾相接的, 如果模型不能理解哺乳动物身体结构, 就容易误判. 在这个测试中, 长颈鹿完美识别, 但是挡住的羚羊少算了一只. 跟之前的 GLM-4.5V 对比还是有进步的, 之前的测试这个是没办法完成的. 然后是网站还原测试, 不过写传统网站相信大家看腻了, 于是这次增大了测试难度, 直接使用了化学实验的图片, 让 GLM-4.6V 使用 three.js 进行建模模拟化学实验. 可以看到电解水试验完成得不错, 除了电池以外其他部分均还原良好. 然后是复杂的场景, 加热生成氧气. 这个的细节是, 所有的试验仪器都还原了, 但是空间位置不对, 不过这个对于头部大模型都是足够困难的测试. 情有可原.

avatar for karminski-牙医
karminski-牙医
Tue Dec 09 07:31:12
Speedtest tracker is a self-hosted application that monitors the performance and uptime of your internet connection

Speedtest tracker is a self-hosted application that monitors the performance and uptime of your internet connection

https://t.co/VeeOT2u96G

avatar for GitHub Projects Community
GitHub Projects Community
Tue Dec 09 07:30:04
借鉴了 Cydiar 的提示词,在 Dessix 里做了个「假装我在用功读论文」指令。图1是效果,图2是论文原始截图。图3是 Dessix 对批注给出的说明。你觉得乍看上去,像不像真人读论文的批注效果呢?各位研究生导师朋友们,组会时别上当啊😜

借鉴了 Cydiar 的提示词,在 Dessix 里做了个「假装我在用功读论文」指令。图1是效果,图2是论文原始截图。图3是 Dessix 对批注给出的说明。你觉得乍看上去,像不像真人读论文的批注效果呢?各位研究生导师朋友们,组会时别上当啊😜

Teach AI for Science on https://t.co/EjMt9Lde9B Youtube: https://t.co/OofaON17z1 Substack: https://t.co/IIleagZfwW 知识星球:https://t.co/kyzMiDmFWb

avatar for Wang Shuyi
Wang Shuyi
Tue Dec 09 07:14:42
RT @indie_maker_fox: 🎁  MkSaaS官网更新 & 分销模式大改进!

MkSaaS使用的是Affonso平台进行分销,最近它更新了一个功能,Program Coupon,这个功能真的很有用。

过去,购买者点击了推荐人的 aff 链接,只有推荐人可以拿到…

RT @indie_maker_fox: 🎁 MkSaaS官网更新 & 分销模式大改进! MkSaaS使用的是Affonso平台进行分销,最近它更新了一个功能,Program Coupon,这个功能真的很有用。 过去,购买者点击了推荐人的 aff 链接,只有推荐人可以拿到…

🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF

avatar for Fox@MkSaaS.com
Fox@MkSaaS.com
Tue Dec 09 07:10:35
  • Previous
  • 1
  • More pages
  • 1216
  • 1217
  • 1218
  • More pages
  • 5634
  • Next