five

ilsp/hellaswag_greek

收藏
Hugging Face2024-04-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ilsp/hellaswag_greek
下载链接
链接失效反馈
官方服务:
资源简介:
HellaSwag Greek数据集是从HellaSwag数据集机器翻译成希腊语的,包含59832个例子。原始数据集用于常识推理的自然语言推理任务。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。数据集的结构包括训练集、验证集和测试集,分别包含39825、10024和9983个例子。数据集的字段包括ind、activity_label、ctx_a、ctx_b、ctx、endings、source_id、split_type、label等。数据集是通过机器翻译生成的,因此可能存在翻译相关的偏差和限制。

HellaSwag Greek数据集是从HellaSwag数据集机器翻译成希腊语的,包含59832个例子。原始数据集用于常识推理的自然语言推理任务。数据集的语言为希腊语,许可证为cc-by-nc-sa-4.0。数据集的结构包括训练集、验证集和测试集,分别包含39825、10024和9983个例子。数据集的字段包括ind、activity_label、ctx_a、ctx_b、ctx、endings、source_id、split_type、label等。数据集是通过机器翻译生成的,因此可能存在翻译相关的偏差和限制。
提供机构:
ilsp
原始信息汇总

数据集卡片概述

数据集详情

数据集描述

  • 语言(NLP): 希腊语 (el)
  • 许可证: cc-by-nc-sa-4.0
  • 数据集大小: 191404110 字节
  • 下载大小: 94638082 字节

数据集结构

特征

  • ind: 整数类型 (int64)
  • activity_label: 字符串类型 (string)
  • ctx_a: 字符串类型 (string)
  • ctx_b: 字符串类型 (string)
  • ctx: 字符串类型 (string)
  • endings: 字符串序列 (sequence: string)
  • source_id: 字符串类型 (string)
  • split_type: 字符串类型 (string)
  • label: 字符串类型 (string)
  • activity_label_orig: 字符串类型 (string)
  • ctx_a_orig: 字符串类型 (string)
  • ctx_b_orig: 字符串类型 (string)
  • ctx_orig: 字符串类型 (string)
  • endings_orig: 字符串序列 (sequence: string)

分割

  • 训练集:
    • 字节数: 126728121
    • 样本数: 39825
  • 验证集:
    • 字节数: 32982220
    • 样本数: 10024
  • 测试集:
    • 字节数: 31693769
    • 样本数: 9983

配置

  • 配置名称: default
    • 数据文件:
      • 训练集: data/train-*
      • 验证集: data/validation-*
      • 测试集: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作