EmpathyRobot
收藏github2025-01-03 更新2025-01-12 收录
下载链接:
https://github.com/xinyan-cxy/EmpathyRobot
下载链接
链接失效反馈官方服务:
资源简介:
EmpathyRobot是第一个专门设计用于基准测试和增强代理在不同场景中的共情行为的数据集。该数据集包含10,000个基于人类反馈的样本,涵盖了多种模态的信息和相应的共情任务规划序列,包括导航和操作。代理需要根据对视觉场景和人类情感的理解来执行动作。
EmpathyRobot is the first dataset specifically designed for benchmarking and enhancing empathetic behaviors of agents across diverse scenarios. This dataset contains 10,000 human-feedback-based samples, covering multi-modal information and corresponding empathetic task planning sequences including navigation and manipulation. Agents are required to perform actions based on their understanding of visual scenes and human emotions.
创建时间:
2024-12-30
原始信息汇总
EmpathyRobot 数据集概述
数据集简介
EmpathyRobot 是一个专门为增强和评估机器人在多样化场景中的共情行为而设计的数据集。该数据集包含 10,000 个基于人类反馈的样本,涵盖了多种模态的信息以及相应的共情任务规划序列,包括导航和操作。机器人需要根据对视觉场景和人类情感的理解来执行动作。
数据集关键统计信息
- 总数据点:10,000
- 角色数量:100
- 输入动作-视频数量:20
- 每个角色-动作对的场景和对话数量:5
- 每个数据点的共情响应数量:2
- 输出的可选动作空间:50
- 动作-视频的平均长度:16.28秒
- 动作-视频的最大长度:24.60秒
- 动作-视频的最小长度:9.40秒
评估框架与指标
EmpathyRobot 提出了一个新颖的评估框架,包含以下三个关键阶段:
- 场景理解(内部共情过程)
- 共情规划(制定共情结果)
- 共情行动(在现实世界中实施响应)
评估结果
关键阶段性能
| 任务/指标 | GPT-4o | GPT-4-turbo | GPT-4-vision | LLaVA |
|---|---|---|---|---|
| 场景理解 | ||||
| Bleu-1 | 19.1 | 14.1 | 15.2 | 13.7 |
| Bleu-4 | 5.3 | 3.1 | 3.3 | 2.7 |
| ROUGE-L | 23.7 | 20.4 | 21.4 | 15.6 |
| CIDEr | 8.8 | 1.6 | 3.1 | 7.2 |
| SPICE | 14.8 | 10.1 | 12.1 | 8.9 |
| BERTScore | 0.622 | 0.612 | 0.615 | 0.576 |
| 共情规划 | ||||
| Bleu-1 | 30.8 | 25.7 | 25.9 | 13.1 |
| Bleu-4 | 12.0 | 6.9 | 6.4 | 2.6 |
| ROUGE-L | 26.1 | 23.5 | 23.4 | 17.3 |
| CIDEr | 25.9 | 14.9 | 15.5 | 3.7 |
| SPICE | 16.7 | 14.5 | 11.8 | 8.4 |
| BERTScore | 0.641 | 0.621 | 0.625 | 0.568 |
| 共情行动 | ||||
| Overlap | 27.60 | 32.14 | 35.20 | 17.19 |
| TF-IDF | 21.03 | 24.76 | 27.69 | 12.09 |
| LCS | 25.17 | 28.92 | 29.58 | 15.21 |
共情特定指标性能
| 任务 | 场景理解 | 场景理解 | 共情规划 | 共情规划 | 共情行动 | 共情行动 |
|---|---|---|---|---|---|---|
| 模型 | GPT-4o | LLaVA | GPT-4o | LLaVA | GPT-4o | LLaVA |
| 动作与对话关联 | 8.21 | 7.25 | 4.77 | 4.10 | 7.00 | 6.10 |
| 连贯性 | 8.57 | 7.96 | 5.51 | 4.58 | 7.41 | 7.09 |
| 情感交流 | 7.46 | 6.56 | 5.16 | 4.04 | 6.69 | 6.36 |
| 个体理解 | 6.91 | 6.64 | 4.63 | 3.92 | 5.69 | 5.39 |
| 情感调节 | - | - | 7.09 | 4.96 | 8.43 | 7.91 |
| 帮助性 | - | - | 5.76 | 4.95 | 8.08 | 7.35 |
| 合法性 | - | - | - | - | 9.97 | 9.46 |
| 适应性 | - | - | 4.50 | 3.49 | 6.19 | 5.31 |
| 总体平均 | 7.79 | 7.10 | 5.35 | 4.29 | 7.43 | 6.87 |
数据集下载
数据集可通过 Hugging Face Dataset 下载。
搜集汇总
数据集介绍

构建方式
EmpathyRobot数据集的构建基于对人类情感反馈的深入分析,涵盖了多种模态信息,包括视觉场景和人类情感。数据集包含10,000个样本,每个样本均基于人类反馈生成,涉及导航和操作等任务规划序列。数据集的构建过程特别注重情感理解与任务执行的结合,确保机器人能够在复杂情境中表现出共情行为。
特点
EmpathyRobot数据集的特点在于其首次专注于机器人共情行为的评估与增强。数据集不仅包含丰富的多模态信息,还引入了新颖的评估框架和指标,涵盖场景理解、共情规划和共情行动三个关键阶段。每个数据点均包含情感响应和可选行动空间,使得数据集能够全面评估机器人在情感驱动任务中的表现。
使用方法
EmpathyRobot数据集的使用方法包括下载数据集文件并通过提供的评估框架进行模型训练与测试。用户可以通过Hugging Face平台获取数据集,并利用其多模态信息进行场景理解、共情规划和行动执行的实验。数据集支持多种评估指标,如BLEU、ROUGE和BERTScore等,帮助用户全面衡量模型在共情任务中的表现。
背景与挑战
背景概述
EmpathyRobot数据集由EmpathaticEmbodiedAI团队于近期推出,旨在填补情感智能领域中机器人共情任务规划的空白。该数据集包含10,000个基于人类反馈的多模态样本,涵盖了视觉场景与人类情感的结合,要求智能体在理解场景和情感的基础上生成共情导向的任务规划。作为首个专注于机器人共情行为的数据集,EmpathyRobot不仅提供了丰富的任务规划序列,还引入了全新的评估框架和指标,涵盖场景理解、共情规划和共情行动三个关键阶段。该数据集的推出为情感计算和机器人行为规划领域提供了重要的研究基础,推动了智能体在复杂场景中的共情能力发展。
当前挑战
EmpathyRobot数据集在解决机器人共情任务规划问题时面临多重挑战。首先,情感理解与任务规划的融合要求智能体具备跨模态信息处理能力,如何准确捕捉人类情感并将其转化为有效的行动序列是一个核心难题。其次,数据集的构建过程中,如何确保多模态数据的对齐与一致性,尤其是在视觉场景与情感反馈的匹配上,存在显著的技术挑战。此外,评估共情行为的复杂性也带来了新的挑战,传统的自然语言处理指标难以全面衡量共情效果,因此需要开发新的评估框架和指标。这些挑战不仅体现在数据集的构建过程中,也对后续模型的训练与评估提出了更高的要求。
常用场景
经典使用场景
EmpathyRobot数据集在机器人情感计算领域具有广泛的应用,特别是在情感导向的任务规划方面。该数据集通过结合视觉场景和人类情感信息,要求机器人根据对场景的理解生成相应的任务规划序列。这一经典使用场景不仅涵盖了导航和操作等实际任务,还强调了情感理解与任务执行的结合,为机器人提供了更为人性化的交互方式。
实际应用
在实际应用中,EmpathyRobot数据集可广泛应用于服务机器人、医疗护理机器人以及教育机器人等领域。例如,在医疗护理场景中,机器人可以通过理解患者的情感状态,生成相应的护理任务规划,提供更为贴心的服务。在教育场景中,机器人能够根据学生的情感反馈调整教学策略,提升学习效果。这些应用场景充分体现了情感智能在机器人领域的实际价值。
衍生相关工作
EmpathyRobot数据集的发布催生了一系列相关研究工作,特别是在情感导向任务规划和多模态情感计算领域。例如,基于该数据集的研究提出了新的情感行为评估方法,进一步优化了机器人情感交互的算法。此外,一些研究还探索了如何将情感智能与强化学习相结合,以提升机器人在复杂场景中的任务执行能力。这些衍生工作为情感智能的发展提供了重要的理论和技术支持。
以上内容由遇见数据集搜集并总结生成



