Starvectortortor多模态SVG生成模型视觉质量显著提高

新闻公告

发布时间：2023-12-25 11:09:30

站长之家（ChinaZ.com）12月21日消息:StarVector该模型是一种多模态SVG生成模型，有效地集成代码生成大型语言模型（CodeLLM）视觉模型使SVG能够生成不受限制的SVG，准确地表示图像像素。

Starvector使用CLIP图像编码器从基于像素的图像中提取视觉表示模块，然后通过适配器将其转换为视觉标记。这些视觉标记提前添加到SVG标记中，Starcoder模型使用下一个标记预测来建模序列，从而有效地学习对齐标记和代码标记。

论文地址:https://arxiv.org/pdf/2312.11556.pdf

为了评估Starvector的性能，本文介绍了SVG-Bench，这是一个用于跨多个数据集和相关指标评估SVG方法的综合基准。在这个基准测试中，引入了新颖的数据集，包括SVG-Stack训练(SVG示例在现实世界中的大型数据集)，并用它来预测Starvector作为SVG的大型基础模型。

结果表明，与目前的方法相比，视觉质量和复杂性处理有了显著的提高，导致了SVG生成技术的显著进步。因此，Starvector为SVG生成技术带来了新的突破，为网页开发和图形设计带来了更多的可能性。

本站文章全部采集于互联网，如涉及版权问题请联系我们删除.联系QQ:888798,本站域名代理为阿里云