five

REALTALK|情感智能数据集|对话系统数据集

收藏
arXiv2025-02-19 更新2025-02-21 收录
情感智能
对话系统
下载链接:
https://github.com/danny911kr/REALTALK
下载链接
链接失效反馈
资源简介:
REALTALK是一个真实世界的长期对话数据集,由10对个体在21天内通过消息应用进行的真实对话组成。数据集包含大约16,000个词/对话,旨在通过直接比较真实世界对话和大型语言模型生成的对话,来研究情感智能属性和角色一致性等挑战。该数据集用于评估模型在长期对话中的情感智能和角色模拟能力,并为开发更加人性化的记忆感知AI提供基准任务。
提供机构:
南加州大学
创建时间:
2025-02-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
REALTALK数据集的构建始于招募10位参与者,他们被要求在21天内通过即时通讯应用程序与不同的伙伴进行至少50条消息的日常对话。这些对话被收集并进行了分析,以评估参与者的情感智能(EI)属性和角色一致性。为了评估LLM的记忆保留能力,还招募了另一组注释者对每个对话中的记忆探索问答对进行标注,并对每个对话会话中的演讲者事件进行标注。
特点
REALTALK数据集的特点在于它是一个真实的、长期的对话语料库,包含21天的真实即时通讯应用对话。它提供了对真实人类交互的直接基准,与现有的基于LLM生成的数据相比,REALTALK展示了真实对话的独特挑战。数据集的分析集中在EI属性和角色一致性上,揭示了与合成对话相比,真实对话中的情感表达多样性和角色稳定性的差异。此外,数据集还包含了超过16,000条消息的对话,每个对话都涵盖了大约21个会话,从而提供了丰富的交互模式。
使用方法
REALTALK数据集的使用方法包括两个基准任务:角色模拟和记忆探索。角色模拟任务评估模型模拟特定用户对话风格的能力,而记忆探索任务测试模型在回答需要长期记忆的针对性问题时,是否能够保留和应用长期上下文。用户可以通过提供对话历史作为输入,来训练和测试模型在模拟特定用户角色和记忆探索任务上的性能。
背景与挑战
背景概述
REALTALK数据集由Dong-Ho Lee, Adyasha Maharana, Jay Pujara, Xiang Ren和Francesco Barbieri等人于2025年创建,旨在为长期、开放域对话能力的研究提供真实世界的数据支持。该数据集包含21天内真实的即时通讯应用对话,为长期对话能力的研究提供了直接的人类互动基准。该数据集的创建填补了现有研究依赖合成数据,缺乏真实世界对话模式信息的空白,对聊天机器人领域的研究具有重要影响。
当前挑战
REALTALK数据集相关的挑战包括:1)解决领域问题的挑战:REALTALK数据集旨在解决现有研究对真实世界对话模式了解不足的问题。2)构建过程中所遇到的挑战:收集长时间、真实世界的、涉及同一参与者的人类对话数据集,确保对话的连贯性和一致性是一个技术难题。
常用场景
经典使用场景
REALTALK数据集被设计用来支持长期、开放域对话的研究,特别是为了训练和评估聊天机器人模型,使其能够回忆过去的交互并展示情感智能。该数据集包含真实的人类对话,为研究者提供了与真实人类交互的直接基准,从而能够更好地理解现实世界中的对话模式。通过分析数据集中的情感智能属性和角色一致性,研究者可以揭示真实对话的独特挑战,并利用这些见解来改进聊天机器人模型的设计。
解决学术问题
REALTALK数据集解决了现有研究过多依赖于合成数据的问题,这些数据无法完全捕捉真实世界对话的复杂性和微妙之处。通过提供真实的、长期的对话数据,REALTALK帮助研究者评估现有模型在情感智能和角色一致性方面的表现,并揭示了LLM模型在模拟真实人类对话时面临的挑战,例如情感表达的多样性、角色稳定性的变化以及长期记忆的应用。这些发现为未来聊天机器人模型的研究提供了重要的指导,并推动了更加人性化的交互模型的发展。
衍生相关工作
REALTALK数据集的发布促进了相关领域的研究,包括长期对话模型、情感智能和角色一致性。基于REALTALK数据集的研究成果已经被用于开发新的评估基准,例如角色模拟和记忆探测,这些基准有助于评估模型在长期对话中的表现。此外,REALTALK数据集还启发了对真实世界对话中情感智能和角色动态的深入研究,以及如何将这些理解应用于聊天机器人模型的开发。这些研究有助于推动聊天机器人技术的进步,使其更加符合人类用户的交互需求。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ERIC (Education Resources Information Center)

ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。

eric.ed.gov 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

Amazon电影评论数据集

该数据集包含从1997年8月至2012年10月期间,Amazon用户对253,059种产品的7,911,684条评论。数据集被添加了真实标签,这些标签是通过爬取/抓取Amazon.com获得的,用于分类产品。

github 收录