EasyText是一项由新加坡国立大学、香港中文大学与Tiamat AI、Liblib AI合作开发的多语言文本渲染框架。基于扩散变换器(DiT)技术,它能将多语言字符编码为字符标记,并通过创新的字符位置编码技术实现精确文本布局控制。研究团队构建了包含100万多语言图像-文本对的大型合成数据集和2万高质量标注图像的精选数据集,用于预训练和微调。实验证明,EasyText在多语言文本渲染、视觉质量和布局感知文本集成方面表现卓越,支持超过十种语言,能处理弯曲和倾斜区域,实现前所未有的文本渲染精度和自然度。
至顶网 科技行者 2025-06-04 12:57:38