five

IEA-dataset|图像美学数据集|情感分析数据集

收藏
github2023-11-26 更新2024-05-31 收录
图像美学
情感分析
下载链接:
https://github.com/junfish/IEA-dataset
下载链接
链接失效反馈
资源简介:
IEA-dataset是一个大规模的图像数据集,包含22086张图像,每张图像都有美学和情感标签。美学标签通过2维的one-hot编码表示,情感标签通过8维的one-hot编码表示,涵盖了娱乐、兴奋、敬畏、满足、厌恶、愤怒、恐惧和悲伤等情感。此外,还提供了审美评分数据,包含10个用户评分和总评分。

IEA-dataset 是一个大规模的图像数据集,包含 22,086 张图像,每张图像均标注了美学和情感标签。美学标签采用二维的 one-hot 编码表示,而情感标签则通过八维的 one-hot 编码呈现,涵盖了娱乐、兴奋、敬畏、满足、厌恶、愤怒、恐惧和悲伤等情感类别。此外,该数据集还提供了审美评分数据,包含 10 位用户的评分以及综合评分。
创建时间:
2019-05-08
原始信息汇总

数据集概述

数据集名称

IEA-dataset

数据集内容

  • 图像数量:22086张
  • 图像文件:包含在final_aes_emo.h5文件中,该文件通过下载链接提供。

标签信息

  • 美学标签aes):

    • 类型:2维,采用one-hot编码
    • 含义:[0, 1]表示高美学质量,[1, 0]表示低美学质量
    • 数量:22086个
  • 情感标签emo):

    • 类型:8维,采用one-hot编码
    • 含义:
      • [1, 0, 0, 0, 0, 0, 0, 0]表示娱乐
      • [0, 1, 0, 0, 0, 0, 0, 0]表示兴奋
      • [0, 0, 1, 0, 0, 0, 0, 0]表示敬畏
      • [0, 0, 0, 1, 0, 0, 0, 0]表示满足
      • [0, 0, 0, 0, 1, 0, 0, 0]表示厌恶
      • [0, 0, 0, 0, 0, 1, 0, 0]表示愤怒
      • [0, 0, 0, 0, 0, 0, 1, 0]表示恐惧
      • [0, 0, 0, 0, 0, 0, 0, 1]表示悲伤
    • 数量:22086个

美学评分

  • 评分文件scores.h5
  • 评分内容
    • 键:score
    • 结构:22086行 * 11列矩阵
    • 描述:
      • 行:1-22086,对应final_aes_emo.h5中的图像索引
      • 列:
        • 1-10:十位用户评分
        • 11:每张图像的总评分

数据集文件结构

  • final_aes_emo.h5:包含图像、美学标签和情感标签
  • scores.h5:包含美学评分
AI搜集汇总
数据集介绍
main_image_url
构建方式
IEA数据集通过大规模图像采集与标注构建而成,涵盖了22,086张图像。每张图像均附有美学质量和情感标签,美学质量以二维独热编码表示,情感则以八维独热编码分类。美学评分由十位用户独立打分,最终汇总为每张图像的总分,确保了数据的多样性和可靠性。
特点
IEA数据集的核心特点在于其双重标注体系,既包含美学质量评分,又涵盖情感分类。美学质量以高低二分类呈现,情感则细分为八种类型,如愉悦、兴奋、敬畏等。此外,数据集提供了详细的用户评分矩阵,便于研究者深入分析美学评分的分布与一致性。
使用方法
使用IEA数据集时,可通过加载h5py文件访问图像及其对应标签。美学评分与情感标签分别存储于不同文件中,研究者可根据需求提取特定维度的数据。该数据集适用于美学质量评估、情感计算及多模态学习等研究领域,为相关算法开发与验证提供了丰富的数据支持。
背景与挑战
背景概述
IEA数据集是一个大规模图像数据集,专注于美学与情感标签的结合研究。该数据集由Zhenshen等人创建,旨在为计算机视觉和情感计算领域提供丰富的多维度标注数据。数据集包含22,086张图像,每张图像均附有美学质量(高或低)和情感类别(如愉悦、兴奋、敬畏等)的独热编码标签。美学评分由十位用户提供,进一步增强了数据的可靠性。IEA数据集的推出为美学评估与情感识别任务提供了重要的基准,推动了相关领域的研究进展。
当前挑战
IEA数据集在解决美学与情感识别问题时面临多重挑战。美学评估具有高度主观性,不同用户对同一图像的美学评分可能存在显著差异,如何有效整合这些主观评分以生成可靠的标签是一个关键问题。情感识别同样复杂,情感表达具有多样性和模糊性,准确标注情感类别需要大量人工干预。此外,数据集的构建过程中,如何确保图像质量、标注一致性以及数据平衡性也是重要的技术挑战。这些挑战不仅影响了数据集的构建效率,也对后续模型的训练与评估提出了更高的要求。
常用场景
经典使用场景
IEA数据集在计算机视觉和情感计算领域具有广泛的应用,尤其是在图像美学质量评估和情感识别任务中。该数据集通过提供大规模图像及其对应的美学和情感标签,为研究人员提供了一个丰富的实验平台。经典的使用场景包括训练深度学习模型以自动评估图像的美学质量,以及识别图像所引发的情感反应。这些任务在社交媒体内容推荐、广告设计和艺术创作等领域具有重要价值。
实际应用
在实际应用中,IEA数据集被广泛用于社交媒体平台的图像内容推荐系统。通过分析用户对图像的美学和情感反应,平台可以更精准地推荐符合用户喜好的内容。此外,该数据集还被应用于广告设计,帮助设计师理解不同图像元素对观众情感的影响,从而优化广告效果。在艺术创作领域,IEA数据集也被用于开发辅助工具,帮助艺术家评估作品的美学价值和情感表达。
衍生相关工作
基于IEA数据集,许多经典的研究工作得以展开。例如,一些研究利用该数据集开发了深度学习模型,用于自动评估图像的美学质量,并取得了显著的成果。此外,还有研究专注于情感识别任务,利用IEA数据集中的情感标签训练模型,以识别图像所引发的特定情感反应。这些衍生工作不仅丰富了图像美学和情感分析的研究内容,还为相关领域的进一步发展奠定了基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

鸭绿江流域与水系 – 世界地理数据大百科辞条

鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39&deg43′57″N-42&deg17′28″N,123&deg35′59″E-128&deg45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km&sup2,其中,中国境内面积32799.22 km&sup2,朝鲜境内面积32416.27 km&sup2。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。

国家对地观测科学数据中心 收录

中国1km分辨率逐月平均气温数据集(1901-2024)

该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

实时天气预报-全国天气预报查询-天气查询-天气api接口-天气预警-天气预报查询-天气预报

天气查询API提供全球城市精准天气数据,支持实时查询及多日预报,返回包括城市、国家、地区、日期、最高/最低温度、天气描述、湿度、风速、风向和降水概率等详细气象信息,采用JSON结构化数据格式,响应快速稳定,适用于各类天气应用、出行规划和数据分析场景。

腾讯云市场 收录