X (Twitter)

阿里AIDC-AI團隊搞了款7B文生圖模型：Ovis-Image，專攻「圖中文字」場景，效果媲美20B+模型從效果看文字渲染能力還可以，文字清晰無扭曲變形，不同字體風格文字能自然融入場景和材質裡其擅長海報、Logo、Banner、UI原型、資訊圖表的生成，可生成各種字體、大小和寬高比 CVTG-2K文字渲染榜，平均正確率92%，高於GPT-4o的85%、Qwen-Image的82% LongText-Bench長文本，英文92.2%，低於GPT4o的95.6%；中文96.4%，高於Qwen-Image的94.6% #OvisImage #AI圖片產生 #AI影像

github：github.com/AIDC-AI/Ovis-I…

来自 AIGCLINK（@aigclink）的推文线程

作者信息

线程正文