ilsp/hellaswag_greek
收藏Hugging Face2024-04-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ilsp/hellaswag_greek
下载链接
链接失效反馈官方服务:
资源简介:
HellaSwag Greek数据集是从HellaSwag数据集机器翻译成希腊语的,包含59832个例子。原始数据集用于常识推理的自然语言推理任务。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。数据集的结构包括训练集、验证集和测试集,分别包含39825、10024和9983个例子。数据集的字段包括ind、activity_label、ctx_a、ctx_b、ctx、endings、source_id、split_type、label等。数据集是通过机器翻译生成的,因此可能存在翻译相关的偏差和限制。
HellaSwag Greek数据集是从HellaSwag数据集机器翻译成希腊语的,包含59832个例子。原始数据集用于常识推理的自然语言推理任务。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。数据集的结构包括训练集、验证集和测试集,分别包含39825、10024和9983个例子。数据集的字段包括ind、activity_label、ctx_a、ctx_b、ctx、endings、source_id、split_type、label等。数据集是通过机器翻译生成的,因此可能存在翻译相关的偏差和限制。
提供机构:
ilsp
原始信息汇总
数据集卡片概述
数据集详情
数据集描述
- 语言(NLP): 希腊语 (el)
- 许可证: cc-by-nc-sa-4.0
- 数据集大小: 191404110 字节
- 下载大小: 94638082 字节
数据集结构
特征
- ind: 整数类型 (int64)
- activity_label: 字符串类型 (string)
- ctx_a: 字符串类型 (string)
- ctx_b: 字符串类型 (string)
- ctx: 字符串类型 (string)
- endings: 字符串序列 (sequence: string)
- source_id: 字符串类型 (string)
- split_type: 字符串类型 (string)
- label: 字符串类型 (string)
- activity_label_orig: 字符串类型 (string)
- ctx_a_orig: 字符串类型 (string)
- ctx_b_orig: 字符串类型 (string)
- ctx_orig: 字符串类型 (string)
- endings_orig: 字符串序列 (sequence: string)
分割
- 训练集:
- 字节数: 126728121
- 样本数: 39825
- 验证集:
- 字节数: 32982220
- 样本数: 10024
- 测试集:
- 字节数: 31693769
- 样本数: 9983
配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 验证集: data/validation-*
- 测试集: data/test-*
- 数据文件:



