jiho283/dialsim-friends
收藏Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/jiho283/dialsim-friends
下载链接
链接失效反馈官方服务:
资源简介:
DialSim数据集是一个用于评估对话代理长期对话理解能力的实时模拟器。数据集包含多个特征,如Episode、Session、Date、Script等,以及与对话相关的各种问题和答案。数据集分为训练集,包含788个样本,总大小为993209018字节。数据集的下载大小为11752309字节。
The DialSim dataset is a real-time simulator designed to evaluate the long-term dialogue understanding capabilities of conversational agents. The dataset includes multiple features such as Episode, Session, Date, Script, and various questions and answers related to dialogues. The dataset is divided into a training set containing 788 samples, with a total size of 993209018 bytes. The download size of the dataset is 11752309 bytes.
提供机构:
jiho283
原始信息汇总
数据集概述
数据集信息
特征
- Episode: 类型为字符串。
- Session: 类型为整数。
- Date: 类型为字符串。
- Script: 类型为字符串。
- hard_qs_past_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- hard_qs_past_options: 序列类型,包含字符串序列。
- hard_qs_past_answers: 序列类型,包含字符串序列。
- hard_qs_cur_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- hard_qs_cur_options: 序列类型,包含字符串序列。
- hard_qs_cur_answers: 序列类型,包含字符串序列。
- hard_qs_fu_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- hard_qs_fu_options: 序列类型,包含字符串序列。
- hard_qs_fu_answers: 序列类型,包含字符串序列。
- hard_qs_past_past_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- hard_qs_past_past_options: 序列类型,包含字符串序列。
- hard_qs_past_past_answers: 序列类型,包含字符串序列。
- hard_qs_cur_past_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- hard_qs_cur_past_options: 序列类型,包含字符串序列。
- hard_qs_cur_past_answers: 序列类型,包含字符串序列。
- easy_qs_ans_w_time_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- easy_qs_ans_w_time_options: 序列类型,包含字符串序列。
- easy_qs_ans_w_time_answers: 序列类型,包含字符串序列。
- easy_qs_ans_w_time_idxes: 序列类型,包含整数序列。
- easy_qs_ans_wo_time_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- easy_qs_ans_wo_time_options: 序列类型,包含字符串序列。
- easy_qs_ans_wo_time_answers: 序列类型,包含字符串序列。
- easy_qs_ans_wo_time_idxes: 序列类型,包含整数序列。
- easy_qs_before_event_unans_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- easy_qs_before_event_unans_options: 序列类型,包含字符串序列。
- easy_qs_before_event_unans_answers: 序列类型,包含字符串序列。
- easy_qs_before_event_unans_idxes: 序列类型,包含整数序列。
- easy_qs_dont_know_unans_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- easy_qs_dont_know_unans_options: 序列类型,包含字符串序列。
- easy_qs_dont_know_unans_answers: 序列类型,包含字符串序列。
- easy_qs_dont_know_unans_idxes: 序列类型,包含整数序列。
- easy_qs_dont_know_unans_time_questions: 包含以下字段,类型均为字符串:
- Chandler
- Joey
- Monica
- Phoebe
- Rachel
- default
- easy_qs_dont_know_unans_time_options: 序列类型,包含字符串序列。
- easy_qs_dont_know_unans_time_answers: 序列类型,包含字符串序列。
- easy_qs_dont_know_unans_time_idxes: 序列类型,包含整数序列。
数据分割
- train: 包含788个样本,数据大小为993,209,018字节。
数据集大小
- 下载大小: 11,752,309字节
- 数据集大小: 993,209,018字节
配置
- default: 数据文件路径为
data/train-*。



