EmotionBench|情感分析数据集|情绪识别数据集
收藏EmotionBench 数据集概述
基本信息
- 情感数量:8种
- 因素数量:36个
- 情境数量:428个
- 人类参考数量:1266个
用途
- 研究用途:仅限研究使用,禁止商业用途
- 主要目标:评估大型语言模型(LLM)的共情能力
使用方法
示例运行
python python run_emotionbench.py --model gpt-3.5-turbo --questionnaire PANAS --emotion ALL --select-count 5 --default-shuffle-count 2 --emotion-shuffle-count 1 --test-count 1
参数说明
-
必选参数:
--model
:测试的模型名称--questionnaire
:选择运行的问卷--emotion
:选择运行的情感--select-count
:每个因素选择的情境数量--default-shuffle-count
:默认情感测量中的不同顺序数量--emotion-shuffle-count
:诱发情感测量中的不同顺序数量--test-count
:相同顺序的运行次数
-
可选参数:
--name-exp
:运行的名称--significance-level
:测试人类与LLM均值差异的显著性水平--mode
:调试模式
支持的情感
- Anger(愤怒)
- Anxiety(焦虑)
- Depression(抑郁)
- Frustration(挫折)
- Jealousy(嫉妒)
- Guilt(内疚)
- Fear(恐惧)
- Embarrassment(尴尬)
问卷列表
- PANAS:积极与消极情感量表
- AGQ:攻击性问卷
- DASS-21:短式抑郁焦虑压力量表
- BDI:贝克抑郁量表
- FDS:挫折不适量表
- MJS:多维嫉妒量表
- GASP:内疚与羞耻倾向量表
- FSS:恐惧调查表
- BFNE:简要负面评价恐惧量表
自定义模型
- 替换
example_generator
函数 - 读取
args.testing_file
中的问题 - 调用自定义LLM并填充结果
论文与引用
- 论文链接:https://arxiv.org/abs/2308.03656
- 引用格式: bibtex @inproceedings{huang2024apathetic, author = {Jen{-}tse Huang and Man Ho Lam and Eric John Li and Shujie Ren and Wenxuan Wang and Wenxiang Jiao and Zhaopeng Tu and Michael R. Lyu}, title = {Apathetic or Empathetic? Evaluating {LLM}s Emotional Alignments with Humans}, booktitle = {Advances in Neural Information Processing Systems 37}, year = {2024} }

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
Billboard-Hot-100
该数据集包含了自1958年以来所有Billboard Hot 100榜单的历史数据,详细记录了每首歌曲的排名、日期、表演者等信息。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录