mikelewis0/deal_or_no_dialog
收藏Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/mikelewis0/deal_or_no_dialog
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Deal or No Deal Negotiator,是一个关于人类之间在多议题谈判任务中进行对话的大型数据集。数据集中的对话是通过自然语言进行的,参与谈判的代理无法观察到对方的奖励函数,必须通过对话达成协议。数据集主要用于训练端到端的谈判模型,文本语言为英语。数据集包含两个配置:dialogues和self_play,分别包含训练、验证和测试集。数据集的创建过程涉及众包,使用了Amazon Mechanical Turk平台上的美国工人进行标注。
该数据集名为Deal or No Deal Negotiator,是一个关于人类之间在多议题谈判任务中进行对话的大型数据集。数据集中的对话是通过自然语言进行的,参与谈判的代理无法观察到对方的奖励函数,必须通过对话达成协议。数据集主要用于训练端到端的谈判模型,文本语言为英语。数据集包含两个配置:dialogues和self_play,分别包含训练、验证和测试集。数据集的创建过程涉及众包,使用了Amazon Mechanical Turk平台上的美国工人进行标注。
提供机构:
mikelewis0
原始信息汇总
数据集概述
- 数据集名称: Deal or No Deal Negotiator
- 数据集别名: Deal or No Deal Negotiator
- 数据集大小: 10K<n<100K
- 语言: 英语
- 许可证: cc-by-4.0
- 多语言性: 单语
- 源数据集: 原创
- 任务类别: 对话
- 配置名称:
- dialogues
- self_play
数据集结构
数据实例
- 对话: 代理之间的对话。
- 输入: 第一个代理的输入。
- partner_input: 另一个代理的输入。
- count: 三个可用项目的计数。
- value: 三个可用项目的价值。
- output: 描述三个项目类型中每个代理分配的数量。
数据字段
- dialogue: 字符串类型。
- input: 序列类型,包含
count(int32)和value(int32)。 - output: 字符串类型。
- partner_input: 序列类型,包含
count(int32)和value(int32)。
数据分割
| 配置名称 | 训练 | 验证 | 测试 |
|---|---|---|---|
| dialogues | 10095 | 1087 | 1052 |
| self_play | 8172 | NA | NA |
数据集创建
注释
- 注释创建者: 众包
- 语言创建者: 众包
- 注释过程: 使用Amazon Mechanical Turk进行,每对话支付$0.15,最高分数额外奖励$0.05。仅限美国境内、95%批准率和至少5000次先前任务的工人。
许可证信息
- 许可证: cc-by-4.0
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个大规模的人类谈判对话集合,用于多议题协商任务研究,包含对话文本和物品分配信息。数据通过亚马逊Mechanical Turk收集,规模在1万到10万条之间,使用英语。
以上内容由遇见数据集搜集并总结生成



