portuguese-benchmark-datasets/story_cloze_pt
收藏Hugging Face2023-12-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/portuguese-benchmark-datasets/story_cloze_pt
下载链接
链接失效反馈官方服务:
资源简介:
这是一个葡萄牙语翻译的xstory_cloze数据集,翻译使用了Google Translate API,并保持了与原始数据集相同的结构。数据集包含故事ID、输入句子、句子测验和正确答案等特征,分为训练集和评估集,分别包含360和1511个示例。
这是一个葡萄牙语翻译的xstory_cloze数据集,翻译使用了Google Translate API,并保持了与原始数据集相同的结构。数据集包含故事ID、输入句子、句子测验和正确答案等特征,分为训练集和评估集,分别包含360和1511个示例。
提供机构:
portuguese-benchmark-datasets
原始信息汇总
数据集概述
数据集名称
- story_cloze_pt
数据集结构
- 该数据集是xstory_cloze dataset的葡萄牙语翻译版本,使用Google Translate API进行翻译。
数据集配置
- 默认配置
- 数据文件
- 训练集:
data/train-* - 评估集:
data/eval-*
- 训练集:
- 数据文件
数据集特征
- 特征列表
story_id:故事ID,数据类型为字符串input_sentence_1:输入句子1,数据类型为字符串input_sentence_2:输入句子2,数据类型为字符串input_sentence_3:输入句子3,数据类型为字符串input_sentence_4:输入句子4,数据类型为字符串sentence_quiz1:句子测验1,数据类型为字符串sentence_quiz2:句子测验2,数据类型为字符串answer_right_ending:正确结尾答案,数据类型为int64
数据集分割
- 训练集
- 字节数:128784
- 样本数:360
- 评估集
- 字节数:537102
- 样本数:1511
数据集大小
- 下载大小:476330字节
- 数据集大小:665886字节



