文章探讨了量化稳态扩散模型中的原创性,提出新方法评估图像生成中的版权原创性。
原文标题:【ICML2024】量化稳定扩散中的原创性
原文作者:数据派THU
冷月清谈:
本文探讨了在文本到图像生成扩散模型中评估原创性的新方法,尤其是版权方面的原创性量化。通过对预训练的稳定扩散模型进行控制实验,研究发现,模型在训练数据多样性足够时,能够有效再现未见过的视觉元素。研究的核心在于提出了一种基于模型重建所需的词元数量来测量图像原创性的方法,这一方法受到法律对原创性定义的启发,旨在评估模型生成原创内容的能力,而不依赖特定提示或模型训练数据的存在。这一发现不仅扩展了对生成模型中原创性的理解,也对未来的版权法律和侵权案件具有重要的启示性和应用价值。
怜星夜思:
1、你认为当前对生成模型中原创性的研究是否足够?还有哪些方面可以深入探讨?
2、你们如何看待量化原创性对版权保护的影响?
3、在文本到图像生成的过程中,除了原创性,还有哪些重要的评估指标值得关注?
2、你们如何看待量化原创性对版权保护的影响?
3、在文本到图像生成的过程中,除了原创性,还有哪些重要的评估指标值得关注?
原文内容

来源:专知本文为论文介绍,建议阅读5分钟
我们通过一个预训练的稳定扩散模型和一个合成数据集演示了我们的方法,展示了词元数量与图像原创性之间的关联性。
本研究针对文本到图像(T2I)生成扩散模型中的原创性量化挑战,特别是聚焦于版权原创性。我们首先通过控制实验评估了T2I模型的创新和泛化能力,揭示出稳定扩散模型在训练数据足够多样化的情况下能够有效地再现未见过的元素。我们的核心见解是,模型熟悉并在训练中频繁看到的概念和图像元素组合在模型的潜在空间中具有更简洁的表示。因此,我们提出了一种利用文本反转来测量图像原创性的方法,基于模型重建图像所需的词元数量来评估原创性。我们的方法受法律定义的原创性启发,旨在评估模型在不依赖特定提示或不需要模型的训练数据的情况下,是否能够生成原创内容。我们通过一个预训练的稳定扩散模型和一个合成数据集演示了我们的方法,展示了词元数量与图像原创性之间的关联性。这项工作有助于理解生成模型中的原创性,并对版权侵权案件具有重要意义。