阿里AIDC-AI團隊搞了款7B文生圖模型:Ovis-Image,專攻「圖中文字」場景,效果媲美20B+模型 從效果看文字渲染能力還可以,文字清晰無扭曲變形,不同字體風格文字能自然融入場景和材質裡 其擅長海報、Logo、Banner、UI原型、資訊圖表的生成,可生成各種字體、大小和寬高比 CVTG-2K文字渲染榜,平均正確率92%,高於GPT-4o的85%、Qwen-Image的82% LongText-Bench長文本,英文92.2%,低於GPT4o的95.6%;中文96.4%,高於Qwen-Image的94.6% #OvisImage #AI圖片產生#AI影像
github:github.com/AIDC-AI/Ovis-I…
