阿里新模型超会写字AI文字告别乱码
大模型里超会写字的模型——阿里新模型Qwen-Image,终于能让图里出现的中文不再乱码了。
先来看下图案例:
- 动画风格的古街场景,准确生成中文牌匾“云计算”“云模型”等;【图1】
- 手写体对联、横批、青花瓷与岳阳楼一并出现在中式厅堂;【图3】
- 英文书店橱窗广告,各类图书和标语完整出现在画面上;【图5】
- 一页风格完整、结构清晰的海报封面,带logo、排版、配图和日期;【图8】
可以看到,该模型中文、英文都能准确生成,排版自然,连对联、海报、PPT也能搞。
悄悄说一句,它还具有图像编辑能力,能用它编辑其他图片中的乱码文字。
再来看跑分,Qwen-Image参数量仅20B,但在GenEval、GEdit、TextCraft等多个基准任务上,它都跑出了SOTA成绩。【图9】
换句话说,这个模型不只是会“画图”,而是具备了图文一体理解与表达的能力。
链接合集:
ModelScope:
Hugging Face:
GitHub:
技术报告: