five

MEMO-Bench|情感分析数据集|多模态模型数据集

收藏
arXiv2024-11-18 更新2024-11-20 收录
情感分析
多模态模型
下载链接:
http://arxiv.org/abs/2411.11235v1
下载链接
链接失效反馈
资源简介:
MEMO-Bench是由上海交通大学、哈佛医学院和鹏城实验室联合创建的一个大型情感分析数据集,旨在评估文本到图像模型和多模态大语言模型在人类情感分析中的能力。该数据集包含7145张由12种文本到图像模型生成的肖像图像,每张图像代表六种基本情感之一。数据集的创建过程包括使用100个不同的提示词生成图像,并通过人工审查确保图像与情感表达的一致性。MEMO-Bench主要应用于情感分析领域,旨在解决AI在情感理解和表达方面的挑战。
提供机构:
上海交通大学、哈佛医学院、鹏城实验室
创建时间:
2024-11-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
MEMO-Bench数据集的构建基于12种文本到图像(T2I)模型,生成了7,145张描绘六种不同情感的肖像图像。每种情感对应100个提示,这些提示被输入到T2I模型中以生成肖像。生成后,图像经过人工审查,以评估图像与提示中预期情感表达的一致性,从而评估T2I模型的情感生成能力。此外,数据集还采用了从粗粒度到细粒度的渐进评估方法,用于评估多模态大语言模型(MLLMs)的情感理解能力。
特点
MEMO-Bench数据集的显著特点在于其综合性和细致性。它不仅包含了大量由不同T2I模型生成的情感肖像,还提供了对这些图像的详细主观注释,包括情感类别、情感强度和图像质量。此外,数据集的评估框架涵盖了从粗粒度到细粒度的情感理解评估,为研究AI在情感分析中的能力提供了全面的工具。
使用方法
MEMO-Bench数据集可用于评估和比较不同文本到图像模型和多模态大语言模型在情感生成和理解方面的性能。研究者可以通过分析生成的图像质量、情感生成准确性以及模型对情感的分类和细粒度理解能力,来评估和改进AI模型在情感分析任务中的表现。此外,数据集的主观注释和渐进评估方法为开发更高级的情感感知AI系统提供了宝贵的资源。
背景与挑战
背景概述
随着人工智能(AI)在多个领域的显著能力,特别是在人机交互(HCI)、具身智能以及虚拟数字人的设计和动画中,AI理解和表达情感的能力日益受到关注。MEMO-Bench数据集由上海交通大学、哈佛医学院和鹏城实验室的研究人员于2024年创建,旨在评估文本到图像(T2I)模型和多模态大语言模型(MLLMs)在人类情感分析中的能力。该数据集包含7,145张描绘六种不同情感的肖像,由12种T2I模型生成,为情感生成和理解提供了全面的基准。
当前挑战
MEMO-Bench数据集面临的挑战包括:1) 在情感生成方面,现有T2I模型在生成负面情感图像时表现不佳;2) 在情感理解方面,MLLMs在区分和识别人类情感时,尤其是在细粒度情感分析中,未能达到人类水平的准确性;3) 数据集构建过程中,手动审查和标注大量图像的复杂性和主观性。这些挑战突显了当前AI在情感理解和生成方面的局限性,为未来研究提供了改进的方向。
常用场景
经典使用场景
MEMO-Bench数据集的经典使用场景在于评估文本到图像(T2I)模型和多模态大语言模型(MLLMs)在人类情感分析中的能力。具体而言,该数据集通过包含7,145张由12种T2I模型生成的情感肖像,提供了对这些模型情感生成能力的全面评估。同时,通过从粗粒度到细粒度的渐进评估方法,MEMO-Bench还测试了MLLMs在情感理解和分类方面的表现,从而为情感分析领域的研究提供了宝贵的资源。
解决学术问题
MEMO-Bench数据集解决了当前AI模型在情感分析中的几个关键学术问题。首先,它填补了现有数据集在评估T2I模型情感生成能力方面的空白,提供了对这些模型在生成不同情感肖像时表现的深入洞察。其次,通过引入多模态大语言模型(MLLMs)的评估框架,MEMO-Bench揭示了这些模型在情感理解和分类中的局限性,特别是在细粒度情感分析方面。这些发现不仅有助于提升AI模型的情感分析能力,还为未来情感智能系统的开发提供了理论基础和实践指导。
衍生相关工作
基于MEMO-Bench数据集,许多相关研究工作得以展开。例如,一些研究通过分析数据集中的情感生成和理解结果,提出了改进T2I模型和MLLMs的新方法,以提升其在情感分析任务中的表现。此外,还有研究利用该数据集开发了新的情感评估工具和算法,进一步推动了情感计算领域的发展。这些衍生工作不仅丰富了情感分析的理论研究,也为实际应用提供了新的技术手段和解决方案。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

CBIS-DDSM

该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录