maxidl/LeoLM-HellaSwag_de-fixed
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/LeoLM-HellaSwag_de-fixed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是LeoLM/HellaSwag_de数据集的修改版本,移除了英文和德文结尾数量不一致的行。数据集包含多个特征,如索引、活动标签、上下文、结尾、来源ID、分割类型、标签等。数据集分为训练集和验证集,训练集包含1000个样本,验证集包含10035个样本。数据集的下载大小为18513367字节,数据集大小为32988091.887970522字节。
该数据集是LeoLM/HellaSwag_de数据集的修改版本,移除了英文和德文结尾数量不一致的行。数据集包含多个特征,如索引、活动标签、上下文、结尾、来源ID、分割类型、标签等。数据集分为训练集和验证集,训练集包含1000个样本,验证集包含10035个样本。数据集的下载大小为18513367字节,数据集大小为32988091.887970522字节。
提供机构:
maxidl
原始信息汇总
数据集概述
数据集信息
-
特征列表:
ind: 类型为int64activity_label: 类型为stringctx_a: 类型为stringctx_b: 类型为stringctx: 类型为stringendings: 类型为sequence的stringsource_id: 类型为stringsplit: 类型为stringsplit_type: 类型为stringlabel: 类型为stringactivity_label_de: 类型为stringctx_de: 类型为stringendings_de: 类型为sequence的stringtranslation_de: 类型为string
-
数据分割:
train:- 字节数: 1592717.0
- 样本数: 1000
validation:- 字节数: 31395374.887970522
- 样本数: 10035
-
数据集大小:
- 下载大小: 18513367
- 数据集大小: 32988091.887970522
配置信息
- 配置名称:
default- 数据文件:
train: 路径为data/train-*validation: 路径为data/validation-*
- 数据文件:



