five

msamogh/gpt-negochat

收藏
Hugging Face2022-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/msamogh/gpt-negochat
下载链接
链接失效反馈
官方服务:
资源简介:
GPT-Negochat语料库是原始Negochat语料库的修改版本,包含雇主和候选人之间的谈判对话。原始语料库中的话语是通过基于模板的自然语言生成模块生成的,因此听起来机械且不真实。GPT-Negochat通过使用GPT-3重新表述这些话语,使对话更接近实际的职位谈判对话,同时保留了话语的原始含义。此外,GPT-Negochat还移除了一小部分极不真实的对话片段,而不影响周围对话的连贯性。数据集支持对话行为分类、报价识别和协议跟踪等任务,所有对话均为英文。
提供机构:
msamogh
原始信息汇总

数据集概述:GPT-Negochat

数据集描述

数据集总结

GPT-Negochat 是一个基于原始Negochat语料库的改进版本,包含雇主与候选人之间的谈判对话。原始语料库中的话语是通过基于模板的自然语言生成模块生成的,因此听起来机械且不够真实。GPT-Negochat利用GPT-3对原始语料库进行修改,使对话更接近真实的职位谈判对话,同时保留了原始话语的意义。此外,GPT-Negochat还移除了一些高度不真实的对话段落,不影响周围对话的连贯性。

支持的任务和排行榜

  • 对话行为分类
  • 报价识别
  • 协议跟踪

语言

  • 英语

数据集结构

数据字段

数据集包含以下字段:

  • role: 对话角色(候选人或雇主)
  • input: 原始Negochat语料库中的话语
  • output: 包含报价等信息的结构化输出
  • augmented_input: 使用GPT-3改写的话语

数据集创建

筛选理由

原始Negochat语料库是少数包含谈判对话中逐句标注报价、接受和拒绝的对话语料库之一。然而,由于其话语是通过模板式自然语言生成系统生成的,导致对话听起来不够真实。我们希望使话语听起来更像实际谈判对话中的话语。

源数据

原始Negochat语料库的初始数据收集和标准化信息可在此处找到:https://github.com/vaskonov/negochat_corpus

标注

GPT-Negochat中的每个话语都是通过改写原始语料库中的话语而生成的,因此直接沿用了原始Negochat语料库的标注。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作