msamogh/gpt-negochat
收藏Hugging Face2022-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/msamogh/gpt-negochat
下载链接
链接失效反馈官方服务:
资源简介:
GPT-Negochat语料库是原始Negochat语料库的修改版本,包含雇主和候选人之间的谈判对话。原始语料库中的话语是通过基于模板的自然语言生成模块生成的,因此听起来机械且不真实。GPT-Negochat通过使用GPT-3重新表述这些话语,使对话更接近实际的职位谈判对话,同时保留了话语的原始含义。此外,GPT-Negochat还移除了一小部分极不真实的对话片段,而不影响周围对话的连贯性。数据集支持对话行为分类、报价识别和协议跟踪等任务,所有对话均为英文。
提供机构:
msamogh
原始信息汇总
数据集概述:GPT-Negochat
数据集描述
数据集总结
GPT-Negochat 是一个基于原始Negochat语料库的改进版本,包含雇主与候选人之间的谈判对话。原始语料库中的话语是通过基于模板的自然语言生成模块生成的,因此听起来机械且不够真实。GPT-Negochat利用GPT-3对原始语料库进行修改,使对话更接近真实的职位谈判对话,同时保留了原始话语的意义。此外,GPT-Negochat还移除了一些高度不真实的对话段落,不影响周围对话的连贯性。
支持的任务和排行榜
- 对话行为分类
- 报价识别
- 协议跟踪
语言
- 英语
数据集结构
数据字段
数据集包含以下字段:
role: 对话角色(候选人或雇主)input: 原始Negochat语料库中的话语output: 包含报价等信息的结构化输出augmented_input: 使用GPT-3改写的话语
数据集创建
筛选理由
原始Negochat语料库是少数包含谈判对话中逐句标注报价、接受和拒绝的对话语料库之一。然而,由于其话语是通过模板式自然语言生成系统生成的,导致对话听起来不够真实。我们希望使话语听起来更像实际谈判对话中的话语。
源数据
原始Negochat语料库的初始数据收集和标准化信息可在此处找到:https://github.com/vaskonov/negochat_corpus
标注
GPT-Negochat中的每个话语都是通过改写原始语料库中的话语而生成的,因此直接沿用了原始Negochat语料库的标注。



