GEM/RiSAWOZ
收藏Hugging Face2022-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GEM/RiSAWOZ
下载链接
链接失效反馈官方服务:
资源简介:
RiSAWOZ是一个中文对话数据集,可用于研究多种对话任务,如对话状态跟踪、对话上下文到文本生成、共指消解和统一的生成省略与共指消解。该数据集由苏州大学和天津大学的研究团队创建,并得到了国家重点研发计划的支持。数据集包含丰富的语义注释,适用于任务导向的对话建模。
提供机构:
GEM
原始信息汇总
数据集概述
数据集基本信息
- 名称: RiSAWOZ
- 语言: 中文 (zh)
- 许可证: cc-by-4.0
- 源数据集: 原始数据
- 任务类别: 对话响应生成
- 数据集大小: 未知
- 多语言性: 未知
- 注释创建者: 众包
- 语言创建者: 未知
数据集详细描述
- 用途: RiSAWOZ是一个中文对话数据集,用于研究多种对话任务,如对话状态跟踪、对话上下文到文本生成、指代消解和统一生成省略与指代消解。
- 主要任务: 对话响应生成
- 通信目标: 生成系统响应,基于对话上下文,跨多个领域。
- 数据结构: 数据集包含多个字段,如对话ID、目标、领域、对话内容等,每个对话轮次包括用户和系统的言语、信念状态、用户和系统的对话动作等。
数据集来源与使用
- 创建者: Jun Quan, Shian Zhang, Qian Cao (Soochow University), Zizhong Li, Deyi Xiong (Tianjin University)
- 资金支持: 国家重点研发项目
- 组织类型: 学术
- 组织: 苏州大学和天津大学
- 许可证: Creative Commons Attribution 4.0 International (cc-by-4.0)
- 联系人: Deyi Xiong (dyxiong@tju.edu.cn)
数据集结构
-
数据字段:
- gem_id
- dialogue_id
- goal
- domains
- dialogue (包含多个字段,如turn_id, user_utterance, system_utterance等)
-
示例实例: 提供了一个详细的对话实例,展示了对话的结构和内容。
数据集使用
- 加载方式: 使用
datasets.load_dataset(GEM/RiSAWOZ)加载数据集。
数据集链接
- 主数据卡: GEM Website
- 论文: ACL Anthology
- 网站: RiSAWOZ Website
- GitHub仓库: RiSAWOZ GitHub
数据集贡献者
- 数据卡贡献者: Tianhao Shen, Chaobin You, Deyi Xiong (Tianjin University)
数据集多语言性和覆盖范围
- 多语言性: 否
- 覆盖语言/方言: 仅覆盖普通话中文
- 覆盖领域: 多个领域,具体领域未明确列出
搜集汇总
数据集介绍

背景与挑战
背景概述
GEM/RiSAWOZ是一个大规模多领域中文对话数据集,专门用于任务导向对话建模,包含超过1.1万条对话和丰富的语义注释(如省略和共指解析)。该数据集支持多种对话任务研究,如对话状态跟踪和上下文生成,覆盖旅游景点、餐厅等12个领域,并提供了详细的对话结构和标注信息。
以上内容由遇见数据集搜集并总结生成



