five

EmoEditSet|情感图像处理数据集|图像内容修改数据集

收藏
github2025-03-10 更新2025-03-15 收录
情感图像处理
图像内容修改
下载链接:
https://github.com/JingyuanYY/EmoEdit
下载链接
链接失效反馈
资源简介:
EmoEditSet是一个大规模的情感图像处理数据集,包含40,120对数据。该数据集通过情感归因和数据构建过程创建,旨在通过内容修改增强情感影响。
创建时间:
2025-02-27
原始信息汇总

EmoEdit 数据集概述

数据集名称

EmoEdit

数据集简介

EmoEdit 是一个用于情感图像操纵的大规模数据集,旨在通过图像修改来唤起特定的情感反应。该数据集通过结合内容修改来增强情感影响,不仅调整颜色和风格,还通过情感归因和数据处理构建了 40,120 对高质量、语义多样的成对数据。

数据集构成

  • EmoEditSet:包含 40,120 对经过情感归因和数据处理的高质量图像数据。
  • EmoAdapter:一种训练模型,用于使现有生成模型具备情感识别能力。

数据集来源

  • EmoSet:用于构建情感因子树。
  • MagicBrushMA5KUnsplash:作为原始图像数据来源。

数据集构建

  • 情感因子树:基于 EmoSet 数据集,通过 emotion_attribution.py 对不同情感类别的图像进行分类,并使用 Summary.py 提取每个类别中的共同特征。
  • 数据构建:从 MagicBrush、MA5K 和 Unsplash 收集数据,计算每张图像的情感分数,并根据分数进行分类和保存。使用 generate_image_LargeScale.py 脚本生成新图像,并通过 split_image_threshold_aes_txt.py 脚本进行筛选。

数据集下载

  • EmoEditSet:可以直接下载(推荐,但未上传)或自行构建。
  • EmoAdapter checkpointEmoEdit-inference-set:可在 Dropbox 下载。

引用信息

@article{yang2024emoedit, title={EmoEdit: Evoking Emotions through Image Manipulation}, author={Yang, Jingyuan and Feng, Jiawei and Luo, Weibin and Lischinski, Dani and Cohen-Or, Daniel and Huang, Hui}, journal={arXiv preprint arXiv:2405.12661}, year={2024} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
EmoEditSet数据集的构建采用了一种基于情感归因和大规模数据构造的方法。首先,通过EmoSet数据集对图像进行情感分类,并使用情感因子树对各类情感进行表征。接着,从多个来源收集图像数据,包括MagicBrush、MA5K和Unsplash等,计算每张图像的情感分数并进行分类。最后,通过生成和过滤过程,创建出具有高质量和语义多样性的图像对,形成最终的EmoEditSet数据集。
特点
该数据集的特点在于其创新地结合了情感归因和内容修改,以增强情感影响。它包含了40,120对通过精心设计的情感因子树和复杂的数据构造过程生成的图像对,这些图像对在情感表达和结构完整性上具有高度的一致性。此外,数据集还展现了良好的泛化能力,能够使现有的生成模型具备情感感知能力。
使用方法
使用EmoEditSet数据集时,用户首先需要下载并放置EmoAdapter检查点文件。接着,修改模型位置并在test.py文件中调整相关设置。通过运行EmoEdit提供的脚本,用户可以训练情感适配器,对图像进行编辑以唤起特定的情感反应。此外,用户还可以根据需要调整指导尺度,以实现不同的编辑效果。
背景与挑战
背景概述
EmoEditSet数据集是在图像情感操纵领域的一个重要成果,由杨静远、冯家伟、罗伟宾等研究人员于2024年提出。该数据集隶属于深圳大学、耶路撒冷希伯来大学和特拉维夫大学的研究项目,旨在通过图像内容修改来增强情感影响,进而推动情感图像操纵(AIM)技术的发展。EmoEditSet包含40,120对通过情感归因和数据构建产生的配对数据,是现有AIM方法中首个结合内容修改以提升情感效果的尝试。该数据集不仅为现有的生成模型引入了情感适配器(Emotion adapter)的概念,而且通过训练该适配器,实现了更精准和深刻的情感唤起。
当前挑战
在构建EmoEditSet的过程中,研究人员面临了诸多挑战。首先,如何精准地调整图像内容以唤起特定情感,同时保持图像原有构成,是一大难题。其次,构建过程中,数据集的构建质量、情感因子的归类以及大规模图像数据的处理与筛选,都对计算资源和处理技术提出了较高要求。此外,在所解决的领域问题中,如何通过图像操纵有效唤起特定情感,同时保持图像的语义完整性和结构完整性,也是该方法需要克服的技术挑战。
常用场景
经典使用场景
EmoEditSet数据集的核心应用场景在于图像情感操纵,即通过修改用户提供的图像以唤起特定的情感反应。此类任务在保持原图构图的同时,需要显著唤起预期的情感,具有双重目标的复杂性。该数据集为此目的提供了大量经过情感归因和构建的数据对,成为研究者在AIM领域进行深度探索的宝贵资源。
实际应用
在实际应用中,EmoEditSet数据集可用于训练情感识别系统,改善图像编辑软件的情感调整功能,甚至应用于虚拟现实和增强现实中,通过图像的情感操纵提升用户体验。
衍生相关工作
基于EmoEditSet数据集,研究者们已经开展了一系列相关工作,如设计了Emotion适配器,并提出了指令损失来捕捉数据对中的语义变化。此外,该数据集的便携性使其能够被应用于其他扩散模型,增强了这些模型在情感知识方面的多样性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Population and Housing Census of 2007 - Ethiopia

Geographic coverage --------------------------- National coverage Analysis unit --------------------------- Household Person Housing unit Universe --------------------------- The census has counted people on dejure and defacto basis. The dejure population comprises all the persons who belong to a given area at a given time by virtue of usual residence, while under defacto approach people were counted as the residents of the place where they found. In the census, a person is said to be a usual resident of a household (and hence an area) if he/she has been residing in the household continuously for at least six months before the census day or intends to reside in the household for six months or longer. Thus, visitors are not included with the usual (dejure) population. Homeless persons were enumerated in the place where they spent the night on the enumeration day. The 2007 census counted foreign nationals who were residing in the city administration. On the other hand all Ethiopians living abroad were not counted. Kind of data --------------------------- Census/enumeration data [cen] Mode of data collection --------------------------- Face-to-face [f2f] Research instrument --------------------------- Two type sof questionnaires were used to collect census data: i) Short questionnaire ii) Long questionnaire Unlike the previous censuses, the contents of the short and long questionnaires were similar both for the urban and rural areas as well as for the entire city. But the short and the long questionnaires differ by the number of variables they contained. That is, the short questionnaire was used to collect basic data on population characteristics, such as population size, sex, age, language, ethnic group, religion, orphanhood and disability. Whereas the long questionnaire includes information on marital status, education, economic activity, migration, fertility, mortality, as well as housing stocks and conditions in addition to those questions contained in a short questionnaire.

catalog.ihsn.org 收录

全国 1∶200 000 数字地质图(公开版)空间数据库

As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.

DataCite Commons 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录