关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

Starvectortortor多模态SVG生成模型 视觉质量显著提高

发布时间:2023-12-25 11:09:30

站长之家(ChinaZ.com)12月21日 消息:StarVector该模型是一种多模态SVG生成模型,有效地集成代码生成大型语言模型(CodeLLM)视觉模型使SVG能够生成不受限制的SVG,准确地表示图像像素。

Starvector使用CLIP图像编码器从基于像素的图像中提取视觉表示模块,然后通过适配器将其转换为视觉标记。这些视觉标记提前添加到SVG标记中,Starcoder模型使用下一个标记预测来建模序列,从而有效地学习对齐标记和代码标记。

image.png

论文地址:https://arxiv.org/pdf/2312.11556.pdf

为了评估Starvector的性能,本文介绍了SVG-Bench,这是一个用于跨多个数据集和相关指标评估SVG方法的综合基准。在这个基准测试中,引入了新颖的数据集,包括SVG-Stack训练(SVG示例在现实世界中的大型数据集),并用它来预测Starvector作为SVG的大型基础模型。

结果表明,与目前的方法相比,视觉质量和复杂性处理有了显著的提高,导致了SVG生成技术的显著进步。因此,Starvector为SVG生成技术带来了新的突破,为网页开发和图形设计带来了更多的可能性。


/template/Home/Zkeys/PC/Static