five

AIGI-VC|AI生成图像数据集|视觉通信数据集

收藏
arXiv2024-12-20 更新2024-12-24 收录
AI生成图像
视觉通信
下载链接:
https://github.com/ytian73/AIGI-VC
下载链接
链接失效反馈
资源简介:
AIGI-VC是一个用于视觉通信中AI生成图像质量评估的数据集,由香港城市大学、华南师范大学和岭南大学共同创建。该数据集包含2500张图像,涵盖14个广告主题和8种情感类型,旨在研究AI生成图像在广告领域的信息清晰度和情感互动效果。数据集通过主观实验收集了粗粒度和细粒度的人类偏好注释,并使用GPT-4o进行详细分析。AIGI-VC主要用于评估AI生成图像在实际应用中的有效性,特别是在视觉通信领域,旨在解决图像质量评估中的信息传递和情感互动问题。
提供机构:
香港城市大学, 华南师范大学, 岭南大学
创建时间:
2024-12-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
AIGI-VC数据集通过结合广告领域的实际应用需求,构建了一个专注于AI生成图像(AIGI)在视觉传播中的可传播性评估的数据库。该数据集包含2500张图像,涵盖14个广告主题和8种情感类型。数据集的构建过程首先利用GPT-4V生成多样化的广告文本和情感提示,确保了内容的多样性和独特性。随后,通过五种主流的文本到图像生成模型(如Stable Diffusion XL、Dall·E 3等)生成图像,并对每张图像进行512×512的标准化处理,以减少分辨率带来的变异性。最终,通过成对比较实验收集了粗粒度和细粒度的人类偏好注释,确保了数据集的丰富性和可靠性。
特点
AIGI-VC数据集的显著特点在于其专注于AI生成图像在实际广告应用中的信息清晰度和情感交互效果。数据集不仅提供了粗粒度的人类偏好选择,还通过GPT-4o和人类专家的协作,提供了细粒度的偏好描述,增强了数据集的可解释性和透明度。此外,数据集涵盖了多种广告主题和情感类型,确保了其在不同应用场景下的广泛适用性。通过这些特点,AIGI-VC为研究AI生成图像在视觉传播中的质量评估提供了独特的视角和丰富的资源。
使用方法
AIGI-VC数据集可用于评估和改进AI生成图像在视觉传播中的质量评估方法。研究者可以通过数据集中的粗粒度和细粒度偏好注释,训练和验证新的图像质量评估模型,特别是针对信息清晰度和情感交互的评估。此外,数据集还提供了多种广告主题和情感类型的子集,便于研究者在特定场景下进行深入分析。通过对比不同模型的性能,研究者可以发现现有方法的不足,并推动更有效的AI生成图像质量评估技术的发展。
背景与挑战
背景概述
AIGI-VC数据集由香港城市大学、华南师范大学和岭南大学联合开发,旨在解决人工智能生成图像(AIGI)在视觉传播中的质量评估问题。该数据集创建于2024年,包含2500张图像,涵盖14个广告主题和8种情感类型。其核心研究问题是如何评估AIGI在广告领域的信息清晰度和情感互动效果,填补了传统图像质量评估(IQA)方法在实际应用中的不足。AIGI-VC数据集的推出对视觉传播领域具有重要意义,为研究者提供了评估AIGI在实际应用中有效性的基准。
当前挑战
AIGI-VC数据集在构建过程中面临两大主要挑战:一是信息清晰度评估,要求图像中的每个元素都能清晰地传达文本信息;二是情感互动评估,要求图像能够有效引发观众的情感共鸣。此外,数据集的构建还面临生成模型多样性、图像质量差异以及人类主观偏好标注的复杂性等问题。这些挑战使得现有的IQA方法在处理AIGI时表现不佳,尤其是在多模态内容和情感互动方面的评估能力有限。
常用场景
经典使用场景
AIGI-VC数据集的经典使用场景主要集中在广告领域的视觉传达效果评估。该数据集通过分析AI生成图像在信息清晰度和情感互动方面的表现,帮助研究人员和广告从业者评估广告图像的质量。具体而言,AIGI-VC通过2500张涵盖14个广告主题和8种情感类型的图像,提供了粗粒度和细粒度的用户偏好标注,从而为广告设计中的图像质量评估提供了基准。
解决学术问题
AIGI-VC数据集解决了传统图像质量评估(IQA)算法在AI生成图像(AIGIs)应用中的局限性。传统IQA算法主要关注低层次的视觉感知,而AIGI-VC则强调图像在实际应用中的信息传达和情感互动效果。通过提供详细的偏好标注和评估维度,AIGI-VC为研究者提供了一个全面的工具,用于评估AI生成图像在广告等视觉传达场景中的有效性,推动了IQA领域的发展。
衍生相关工作
AIGI-VC数据集的发布催生了一系列相关研究工作,特别是在AI生成图像的质量评估和多模态模型应用方面。例如,基于AIGI-VC的评估方法被用于改进现有的IQA算法,使其能够更好地处理多模态内容。此外,AIGI-VC还启发了对大规模多模态模型(LMMs)在图像质量评估中的应用研究,推动了多模态模型在广告和视觉传达领域的进一步发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国裁判文书网

中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。

wenshu.court.gov.cn 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

ChemBL

ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。

www.ebi.ac.uk 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录