five

Expert-labeled Aesthetics Perception Database (EAPD)|美学感知数据集|图像数据库数据集

收藏
arXiv2024-01-16 更新2024-06-21 收录
美学感知
图像数据库
下载链接:
https://github.com/yipoh/AesBench
下载链接
链接失效反馈
资源简介:
Expert-labeled Aesthetics Perception Database (EAPD)是由西安电子科技大学构建的高质量图像数据库,包含2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像。该数据集由美学领域的专业专家进行高质量标注,旨在通过精细的设计全面评估多模态大型语言模型(MLLMs)的美学感知能力。EAPD不仅用于评估MLLMs在美学感知、共鸣、评估和解释四个方面的能力,还推动了智能摄影、相册管理、照片推荐和图像增强等应用领域的发展。
提供机构:
西安电子科技大学
创建时间:
2024-01-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
Expert-labeled Aesthetics Perception Database (EAPD) 的构建过程分为三个主要阶段:数据收集、专家选择和主观实验。首先,从多个数据集中收集了2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像。随后,通过严格的筛选标准招募了32位具有丰富美学经验的专家。最后,这些专家使用本地部署的注释工具对图像进行高质量的注释,确保了数据集的可靠性和多样性。
特点
EAPD 数据集的显著特点在于其高质量的专家注释和图像内容的多样性。每张图像都由专业的美学专家进行注释,确保了注释的准确性和深度。此外,数据集包含了自然图像、艺术图像和人工智能生成的图像,提供了广泛的美学感知评估场景,使得该数据集在多模态大语言模型(MLLMs)的美学感知能力评估中具有重要价值。
使用方法
EAPD 数据集主要用于评估多模态大语言模型(MLLMs)在图像美学感知方面的能力。通过提供高质量的专家注释,研究人员可以利用该数据集来测试和提升模型在美学感知、美学共情、美学评估和美学解释四个维度上的表现。此外,数据集的多样性也使得其适用于不同类型的图像美学感知研究,为模型的进一步优化和应用提供了坚实的基础。
背景与挑战
背景概述
在多模态大语言模型(MLLMs)的蓬勃发展背景下,图像美学感知能力的评估成为一个亟待解决的问题。Expert-labeled Aesthetics Perception Database (EAPD) 由西安电子科技大学和南洋理工大学的研究团队于2024年创建,旨在为MLLMs在图像美学感知任务上的表现提供一个高质量的基准。该数据集包含了2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像,并由专业美学专家进行高质量标注。EAPD的构建不仅填补了MLLMs在美学感知评估上的空白,还推动了智能摄影、相册管理和图像增强等实际应用的发展。
当前挑战
EAPD在构建过程中面临多重挑战。首先,图像内容的多样性和高质量标注的获取是主要难题,需要专业美学专家的参与。其次,MLLMs在美学感知任务上的表现仍处于初级阶段,与人类水平存在显著差距。此外,现有的评估标准主要集中在语言或视觉任务上,缺乏针对美学感知任务的专门基准。最后,如何准确评估MLLMs在美学感知任务上的表现,尤其是在情感共鸣、美学评估和解释等方面的能力,仍是一个开放的研究问题。
常用场景
经典使用场景
Expert-labeled Aesthetics Perception Database (EAPD) 最经典的使用场景在于评估多模态大语言模型(MLLMs)在图像美学感知任务中的表现。通过提供多样化且高质量的图像内容和专业美学专家的标注,EAPD 能够全面评估 MLLMs 在美学感知、共情、评估和解释四个维度上的能力。这种评估不仅有助于揭示当前 MLLMs 在美学感知方面的局限性,还为未来模型的改进提供了宝贵的数据支持。
实际应用
在实际应用中,EAPD 可以广泛应用于智能摄影、相册管理、照片推荐和图像增强等领域。通过评估和提升 MLLMs 在美学感知方面的能力,EAPD 有助于开发出更智能、更符合人类审美的图像处理工具。例如,在智能摄影中,EAPD 可以帮助相机自动调整拍摄参数以捕捉更具美感的照片;在相册管理中,EAPD 可以用于自动分类和推荐高美感的照片。
衍生相关工作
EAPD 的推出催生了大量相关研究工作,特别是在多模态大语言模型的美学感知能力评估和改进方面。例如,基于 EAPD 的研究已经提出了多种新的评估标准和方法,如 AesBench 中的四维度评估框架。此外,EAPD 还激发了在图像美学感知任务中应用 GPT 辅助评估策略的研究,进一步提升了评估的准确性和可靠性。这些衍生工作不仅丰富了美学感知领域的研究内容,也为实际应用提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

中国光伏电站空间分布ChinaPV数据集(2015,2020年)

该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。

国家地球系统科学数据中心 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录