five

mikelewis0/deal_or_no_dialog

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/mikelewis0/deal_or_no_dialog
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Deal or No Deal Negotiator,是一个关于人类之间在多议题谈判任务中进行对话的大型数据集。数据集中的对话是通过自然语言进行的,参与谈判的代理无法观察到对方的奖励函数,必须通过对话达成协议。数据集主要用于训练端到端的谈判模型,文本语言为英语。数据集包含两个配置:dialogues和self_play,分别包含训练、验证和测试集。数据集的创建过程涉及众包,使用了Amazon Mechanical Turk平台上的美国工人进行标注。

该数据集名为Deal or No Deal Negotiator,是一个关于人类之间在多议题谈判任务中进行对话的大型数据集。数据集中的对话是通过自然语言进行的,参与谈判的代理无法观察到对方的奖励函数,必须通过对话达成协议。数据集主要用于训练端到端的谈判模型,文本语言为英语。数据集包含两个配置:dialogues和self_play,分别包含训练、验证和测试集。数据集的创建过程涉及众包,使用了Amazon Mechanical Turk平台上的美国工人进行标注。
提供机构:
mikelewis0
原始信息汇总

数据集概述

  • 数据集名称: Deal or No Deal Negotiator
  • 数据集别名: Deal or No Deal Negotiator
  • 数据集大小: 10K<n<100K
  • 语言: 英语
  • 许可证: cc-by-4.0
  • 多语言性: 单语
  • 源数据集: 原创
  • 任务类别: 对话
  • 配置名称:
    • dialogues
    • self_play

数据集结构

数据实例

  • 对话: 代理之间的对话。
  • 输入: 第一个代理的输入。
  • partner_input: 另一个代理的输入。
  • count: 三个可用项目的计数。
  • value: 三个可用项目的价值。
  • output: 描述三个项目类型中每个代理分配的数量。

数据字段

  • dialogue: 字符串类型。
  • input: 序列类型,包含count(int32)和value(int32)。
  • output: 字符串类型。
  • partner_input: 序列类型,包含count(int32)和value(int32)。

数据分割

配置名称 训练 验证 测试
dialogues 10095 1087 1052
self_play 8172 NA NA

数据集创建

注释

  • 注释创建者: 众包
  • 语言创建者: 众包
  • 注释过程: 使用Amazon Mechanical Turk进行,每对话支付$0.15,最高分数额外奖励$0.05。仅限美国境内、95%批准率和至少5000次先前任务的工人。

许可证信息

  • 许可证: cc-by-4.0
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个大规模的人类谈判对话集合,用于多议题协商任务研究,包含对话文本和物品分配信息。数据通过亚马逊Mechanical Turk收集,规模在1万到10万条之间,使用英语。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作