five

shermansiu/sgd_dst

收藏
Hugging Face2023-12-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shermansiu/sgd_dst
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含Schema-Guided Dialogue数据集,根据以下两篇对话状态跟踪论文的提示格式进行格式化:描述驱动的对话状态跟踪(D3ST)(Zhao等,2022)和展示而非讲述(SDT)(Gupta等,2022)。数据集包含两个配置(sgd-sdt和sgd-d3st),每个配置都有训练、开发和测试三个分割。数据集的特征包括提示(prompt)、目标(target)、对话ID(dialogue_id)、轮次ID(turn_id)和框架ID(frame_id)。
提供机构:
shermansiu
原始信息汇总

Schema-Guided Dialogue dataset - Dialogue State Tracking

概述

该数据集包含Schema-Guided Dialogue Dataset,格式遵循以下两篇对话状态跟踪论文的提示格式:

配置

sgd-sdt

  • 数据文件
    • 训练集:sdt/sgd_sdt_v0_train.tsv
    • 验证集:sdt/sgd_sdt_v0_dev.tsv
    • 测试集:sdt/sgd_sdt_v0_test.tsv
  • 特征
    • prompt:字符串
    • target:字符串
    • dialogue_id:字符串
    • turn_id:字符串
    • frame_id:字符串
  • 拆分
    • 训练集:269690581字节,175780个样本
    • 验证集:38376392字节,26077个样本
    • 测试集:72134551字节,46116个样本

sgd-d3st

  • 数据文件
    • 训练集:d3st/sgd_d3st_v0_train.tsv
    • 验证集:d3st/sgd_d3st_v0_dev.tsv
    • 测试集:d3st/sgd_d3st_v0_test.tsv
  • 特征
    • prompt:字符串
    • target:字符串
    • dialogue_id:字符串
    • turn_id:字符串
    • frame_id:字符串
  • 拆分
    • 训练集:226090375字节,175780个样本
    • 验证集:32170435字节,26077个样本
    • 测试集:59997238字节,46116个样本
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作