five

ArtELingo-28|多语言情感标注数据集|跨文化情感理解数据集

收藏
arXiv2024-11-06 更新2024-11-08 收录
多语言情感标注
跨文化情感理解
下载链接:
https://www.artelingo.org/
下载链接
链接失效反馈
资源简介:
ArtELingo-28是由阿卜杜拉国王科技大学创建的一个视觉语言基准数据集,涵盖了28种语言,包含约200,000个标注。该数据集基于WikiArt图像,每张图像有约140个情感标签和多语言描述,旨在捕捉不同语言和文化背景下的主观情感差异。数据集的创建过程涉及220名来自23个国家的标注者,通过Amazon Mechanical Turk平台进行标注。ArtELingo-28主要用于评估机器学习系统在多语言环境下的情感标注能力,旨在解决跨文化情感理解和表达的问题。
提供机构:
阿卜杜拉国王科技大学
创建时间:
2024-11-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
ArtELingo-28数据集的构建基于WikiArt平台上的2000幅图像,通过Amazon Mechanical Turk和aiXplain等平台招募了来自23个国家的220名母语标注者。这些标注者被要求在仔细观察图像后,从8种情感标签中选择最主要的情感,并提供相应的情感解释。此外,标注者还可以选择“其他”选项,如果他们的感受与提供的8种情感不符。每幅图像由五名不同的标注者进行标注,确保了情感和语言多样性的充分体现。
特点
ArtELingo-28数据集的显著特点在于其跨语言和跨文化的多样性。该数据集涵盖了28种语言,包括多种低资源语言,如非洲、东南亚和南亚的语言。每幅图像平均有140条标注,这些标注不仅包括情感标签,还有详细的情感解释,反映了不同文化和语言背景下对艺术作品的多样化解读。
使用方法
ArtELingo-28数据集主要用于评估和训练多语言情感图像描述生成模型。研究者可以使用该数据集进行零样本、少样本和一对一零样本等多种实验设置,以测试模型在不同语言和文化背景下的泛化能力。此外,数据集还可用于研究跨语言情感转移和文化差异对情感感知的影响,为构建更加通用和包容的视觉语言模型提供支持。
背景与挑战
背景概述
ArtELingo-28数据集由KAUST、牛津大学和东北大学的研究人员共同创建,旨在解决视觉与语言研究中多语言多样性的缺失问题。该数据集于2024年发布,包含来自WikiArt的2000幅图像,每幅图像附有28种语言的情感标签和文本解释,总计约20万条注释。其核心研究问题在于构建能够跨语言和文化多样性进行情感图像描述的机器学习系统。ArtELingo-28不仅扩展了多语言覆盖范围,还强调了文化背景对情感表达的影响,对多模态AI领域具有重要影响力。
当前挑战
ArtELingo-28数据集面临的主要挑战包括:1) 构建过程中需要克服多语言注释的复杂性,特别是对于低资源语言的注释获取和质量控制;2) 数据集旨在解决情感图像描述的跨文化差异问题,这要求模型能够理解和适应不同文化背景下的情感表达;3) 数据集的多样性和大规模注释增加了模型训练和评估的复杂性,特别是在零样本和少样本学习场景下,模型的跨语言迁移能力面临严峻考验。
常用场景
经典使用场景
ArtELingo-28数据集的经典使用场景在于其跨语言和跨文化的情感标注能力。该数据集通过在28种不同语言中对WikiArt图像进行情感标签和文本解释的标注,为视觉与语言研究提供了一个多元化的基准。其核心任务是构建能够为图像分配情感标注的机器学习系统,特别是在零样本、少样本和一对多零样本设置下的表现评估。
衍生相关工作
ArtELingo-28数据集的发布催生了一系列相关研究工作,特别是在多模态学习和跨语言情感分析领域。例如,基于该数据集的零样本和少样本学习方法研究,以及一对多零样本设置下的模型评估,都取得了显著进展。此外,该数据集还激发了对多语言大语言模型(MLLMs)在视觉与语言理解任务中应用的探索,推动了通用视觉语言模型的跨语言能力研究。
数据集最近研究
最新研究方向
在视觉与语言研究领域,ArtELingo-28数据集的最新研究方向聚焦于多语言情感图像描述生成。该数据集通过引入28种语言的情感标签和描述,强调了跨语言和文化多样性的重要性。研究者们致力于构建能够跨语言生成情感描述的机器学习系统,特别是在零样本、少样本和一对多零样本设置下进行评估。这些研究不仅推动了多语言情感理解的前沿,还揭示了文化背景对情感感知和表达的影响,为构建更具包容性和文化敏感性的视觉语言模型奠定了基础。
相关研究论文
  • 1
    No Culture Left Behind: ArtELingo-28, a Benchmark of WikiArt with Captions in 28 Languages阿卜杜拉国王科技大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录

stochastic/random_streetview_images_pano_v0.0.2

随机街景图像数据集是从randomstreetview.com抓取的带有标签的全景图像。每张图像显示一个可以通过Google Street View访问的位置,这些图像被大致组合以提供单个位置的约360度视角。该数据集的设计目的是仅基于其视觉内容对图像进行地理定位。数据集包含约10,000张图像,涵盖了55个国家的约175张照片,主要集中在欧洲和亚洲。

hugging_face 收录

全国景区数据

  中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。  CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!

CnOpenData 收录