TalTechNLP/dialogsum_ee
收藏Hugging Face2024-04-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TalTechNLP/dialogsum_ee
下载链接
链接失效反馈官方服务:
资源简介:
Dialogsum EE是一个爱沙尼亚语的对话摘要数据集,它是Dialogsum数据集的机器翻译子集。数据集包含对话的唯一标识符、爱沙尼亚语的对话文本、爱沙尼亚语的对话摘要、对话主题、英语的对话文本和英语的对话摘要。数据集分为训练集、验证集和测试集,分别包含12460、500和1500个样本。数据集的下载大小为14384437字节,总大小为26251257字节。
Dialogsum EE是一个爱沙尼亚语的对话摘要数据集,它是Dialogsum数据集的机器翻译子集。数据集包含对话的唯一标识符、爱沙尼亚语的对话文本、爱沙尼亚语的对话摘要、对话主题、英语的对话文本和英语的对话摘要。数据集分为训练集、验证集和测试集,分别包含12460、500和1500个样本。数据集的下载大小为14384437字节,总大小为26251257字节。
提供机构:
TalTechNLP
原始信息汇总
数据集描述
Dialogsum EE 是一个爱沙尼亚语对话摘要数据集,是 Dialogsum 数据集的机器翻译子集。
支持的任务和排行榜
更多信息待补充。
语言
爱沙尼亚语
数据集结构
数据字段
- id: 数据点的唯一标识符。
- dialogue: 爱沙尼亚语的对话记录。
- summary: 爱沙尼亚语的对话摘要。
- topic: 对话主题名称。
- en_dialogue: 英语的对话记录。
- en_summary: 英语的对话摘要。
数据分割
- train:
- 字节数: 22666234
- 样本数: 12460
- validation:
- 字节数: 881912
- 样本数: 500
- test:
- 字节数: 2703111
- 样本数: 1500
数据集大小
- 下载大小: 14384437 字节
- 数据集大小: 26251257 字节



