five

Snoopy04/hellaswag-sv-500

收藏
Hugging Face2024-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Snoopy04/hellaswag-sv-500
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如split(分割类型)、ind(索引)、split_type(分割类型)、ctx_a(上下文A)、ctx(上下文)、id(标识符)、label(标签)、endings(结尾)、ctx_b(上下文B)、activity_label(活动标签)、source_id(源ID)、query(查询)、choices(选择)和gold(黄金标准)。数据集分为训练集和测试集,每个集合包含500个例子,用于机器学习模型的训练和测试。

该数据集包含多个特征,如split(分割类型)、ind(索引)、split_type(分割类型)、ctx_a(上下文A)、ctx(上下文)、id(标识符)、label(标签)、endings(结尾)、ctx_b(上下文B)、activity_label(活动标签)、source_id(源ID)、query(查询)、choices(选择)和gold(黄金标准)。数据集分为训练集和测试集,每个集合包含500个例子,用于机器学习模型的训练和测试。
提供机构:
Snoopy04
原始信息汇总

数据集概述

数据特征

  • split: 数据分割类型,数据类型为字符串。
  • ind: 索引,数据类型为整数。
  • split_type: 分割类型,数据类型为字符串。
  • ctx_a: 上下文A,数据类型为字符串。
  • ctx: 上下文,数据类型为字符串。
  • id: 标识符,数据类型为字符串。
  • label: 标签,数据类型为字符串。
  • endings: 结尾序列,数据类型为字符串序列。
  • ctx_b: 上下文B,数据类型为字符串。
  • activity_label: 活动标签,数据类型为字符串。
  • source_id: 源标识符,数据类型为字符串。
  • query: 查询,数据类型为字符串。
  • choices: 选项序列,数据类型为字符串序列。
  • gold: 黄金标准,数据类型为整数。

数据分割

  • train: 训练集,包含500个样本,大小为1030308.594606446字节。
  • test: 测试集,包含500个样本,大小为1030308.594606446字节。

数据集大小

  • 下载大小: 1215911字节。
  • 数据集大小: 2060617.189212892字节。

配置

  • default: 默认配置,包含训练集和测试集文件路径。
    • 训练集路径: data/train-*
    • 测试集路径: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作