five

lighteval/drop_harness

收藏
Hugging Face2023-07-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lighteval/drop_harness
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: section_id dtype: string - name: passage dtype: string - name: question dtype: string - name: query_id dtype: string - name: answer struct: - name: number dtype: string - name: date struct: - name: day dtype: string - name: month dtype: string - name: year dtype: string - name: spans sequence: string - name: worker_id dtype: string - name: hit_id dtype: string - name: validated_answers sequence: - name: number dtype: string - name: date struct: - name: day dtype: string - name: month dtype: string - name: year dtype: string - name: spans sequence: string - name: worker_id dtype: string - name: hit_id dtype: string splits: - name: train num_bytes: 108858121 num_examples: 77409 - name: validation num_bytes: 12560739 num_examples: 9536 download_size: 12003555 dataset_size: 121418860 --- # Dataset Card for "drop_harness" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征字段: - 段落编号(section_id):字符串类型 - 篇章文本(passage):字符串类型 - 问题文本(question):字符串类型 - 查询编号(query_id):字符串类型 - 答案(answer):结构体,包含以下子字段: - 数字答案(number):字符串类型 - 日期(date):结构体,包含: - 日(day):字符串类型 - 月(month):字符串类型 - 年(year):字符串类型 - 匹配片段(spans):字符串序列 - 标注人员编号(worker_id):字符串类型 - 任务编号(hit_id):字符串类型 - 已验证答案(validated_answers):结构体序列,每个结构体包含以下子字段: - 数字答案(number):字符串类型 - 日期(date):结构体,包含: - 日(day):字符串类型 - 月(month):字符串类型 - 年(year):字符串类型 - 匹配片段(spans):字符串序列 - 标注人员编号(worker_id):字符串类型 - 任务编号(hit_id):字符串类型 数据集划分: - 训练集(train):字节数108858121,样本数77409 - 验证集(validation):字节数12560739,样本数9536 下载大小:12003555字节,数据集总大小:121418860字节 # "drop_harness"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
lighteval
原始信息汇总

数据集概述

数据集特征

  • section_id: 字符串类型
  • passage: 字符串类型
  • question: 字符串类型
  • query_id: 字符串类型
  • answer: 结构化数据,包含以下子特征:
    • number: 字符串类型
    • date: 结构化数据,包含以下子特征:
      • day: 字符串类型
      • month: 字符串类型
      • year: 字符串类型
    • spans: 序列,字符串类型
    • worker_id: 字符串类型
    • hit_id: 字符串类型
  • validated_answers: 序列,包含以下子特征:
    • number: 字符串类型
    • date: 结构化数据,包含以下子特征:
      • day: 字符串类型
      • month: 字符串类型
      • year: 字符串类型
    • spans: 序列,字符串类型
    • worker_id: 字符串类型
    • hit_id: 字符串类型

数据集分割

  • train:
    • 数据量: 108858121 字节
    • 示例数量: 77409
  • validation:
    • 数据量: 12560739 字节
    • 示例数量: 9536

数据集大小

  • 下载大小: 12003555 字节
  • 数据集总大小: 121418860 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作