five

runsdata/semantic-consistency-score

收藏
Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/runsdata/semantic-consistency-score
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集引入了一种新的、可解释的定量指标——语义一致性评分(Semantic Consistency Score),用于测量扩散模型中图像生成的可重复性或一致性。通过使用成对的平均CLIP(对比语言-图像预训练)评分,该方法提供了一种新颖的方式来评估和比较图像生成模型在语义层面上的性能。数据集包含使用PixArt-α、SDXL以及LoRA微调版本的SDXL生成的图像,用于评估这些模型在语义层面上的性能。研究结果表明,PixArt-α在图像生成方面表现出更高的一致性,而LoRA微调版本的SDXL在语义一致性方面有显著提升。该数据集可用于开发PixArt-α和SDXL的评估指标,并支持用户对这些模型的研究。

该数据集引入了一种新的、可解释的定量指标——语义一致性评分(Semantic Consistency Score),用于测量扩散模型中图像生成的可重复性或一致性。通过使用成对的平均CLIP(对比语言-图像预训练)评分,该方法提供了一种新颖的方式来评估和比较图像生成模型在语义层面上的性能。数据集包含使用PixArt-α、SDXL以及LoRA微调版本的SDXL生成的图像,用于评估这些模型在语义层面上的性能。研究结果表明,PixArt-α在图像生成方面表现出更高的一致性,而LoRA微调版本的SDXL在语义一致性方面有显著提升。该数据集可用于开发PixArt-α和SDXL的评估指标,并支持用户对这些模型的研究。
提供机构:
runsdata
原始信息汇总

数据集描述

本研究引入了一种新的可解释量化指标,称为语义一致性分数(Semantic Consistency Score),旨在测量扩散模型中图像生成的重复性或一致性。该方法通过使用成对平均CLIP(Contrastive Language-Image Pretraining)分数,提供了一种新颖的方法来评估和比较图像生成模型在语义层面的性能。

此数据集包含了使用PixArt-α、SDXL及LoRA微调版本的SDXL为该研究生成的所有图像。数据集用于评估PixArt-α和SDXL的性能,并揭示了PixArt-α在图像生成中表现出更高的语义一致性。此外,还比较了SDXL与LoRA微调后的SDXL的语义一致性,发现微调模型在语义一致性上有显著提升。

数据集来源

  • 模型: PixArt-α, SDXL, LoRA微调的SDXL
  • 数据集结构: dataset/ └── model/ └── prompt_used_for_generation/ ├── image_generated_1.jpg ├── image_generated_2.jpg ├── image_generated_3.jpg └── ...

数据集创建

SDXL和PixArt-α的数据采集

使用大型语言模型生成100个独特提示,用于图像生成模型。所有提示在模型间标准化,并使用预定义随机种子确保研究可重复性。

LoRA模型开发和数据采集

对SDXL进行低秩适应(LoRA)微调,使用九幅Monet画作进行训练。使用50个提示,并修改提示以适应SDXL和LoRA模型。

数据集用途

  • 用于开发评估PixArt-α和SDXL的指标。
  • 可用于这些模型的用户研究。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作