lighteval/drop_harness
收藏Hugging Face2023-07-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lighteval/drop_harness
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: section_id
dtype: string
- name: passage
dtype: string
- name: question
dtype: string
- name: query_id
dtype: string
- name: answer
struct:
- name: number
dtype: string
- name: date
struct:
- name: day
dtype: string
- name: month
dtype: string
- name: year
dtype: string
- name: spans
sequence: string
- name: worker_id
dtype: string
- name: hit_id
dtype: string
- name: validated_answers
sequence:
- name: number
dtype: string
- name: date
struct:
- name: day
dtype: string
- name: month
dtype: string
- name: year
dtype: string
- name: spans
sequence: string
- name: worker_id
dtype: string
- name: hit_id
dtype: string
splits:
- name: train
num_bytes: 108858121
num_examples: 77409
- name: validation
num_bytes: 12560739
num_examples: 9536
download_size: 12003555
dataset_size: 121418860
---
# Dataset Card for "drop_harness"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 段落编号(section_id):字符串类型
- 篇章文本(passage):字符串类型
- 问题文本(question):字符串类型
- 查询编号(query_id):字符串类型
- 答案(answer):结构体,包含以下子字段:
- 数字答案(number):字符串类型
- 日期(date):结构体,包含:
- 日(day):字符串类型
- 月(month):字符串类型
- 年(year):字符串类型
- 匹配片段(spans):字符串序列
- 标注人员编号(worker_id):字符串类型
- 任务编号(hit_id):字符串类型
- 已验证答案(validated_answers):结构体序列,每个结构体包含以下子字段:
- 数字答案(number):字符串类型
- 日期(date):结构体,包含:
- 日(day):字符串类型
- 月(month):字符串类型
- 年(year):字符串类型
- 匹配片段(spans):字符串序列
- 标注人员编号(worker_id):字符串类型
- 任务编号(hit_id):字符串类型
数据集划分:
- 训练集(train):字节数108858121,样本数77409
- 验证集(validation):字节数12560739,样本数9536
下载大小:12003555字节,数据集总大小:121418860字节
# "drop_harness"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
lighteval
原始信息汇总
数据集概述
数据集特征
- section_id: 字符串类型
- passage: 字符串类型
- question: 字符串类型
- query_id: 字符串类型
- answer: 结构化数据,包含以下子特征:
- number: 字符串类型
- date: 结构化数据,包含以下子特征:
- day: 字符串类型
- month: 字符串类型
- year: 字符串类型
- spans: 序列,字符串类型
- worker_id: 字符串类型
- hit_id: 字符串类型
- validated_answers: 序列,包含以下子特征:
- number: 字符串类型
- date: 结构化数据,包含以下子特征:
- day: 字符串类型
- month: 字符串类型
- year: 字符串类型
- spans: 序列,字符串类型
- worker_id: 字符串类型
- hit_id: 字符串类型
数据集分割
- train:
- 数据量: 108858121 字节
- 示例数量: 77409
- validation:
- 数据量: 12560739 字节
- 示例数量: 9536
数据集大小
- 下载大小: 12003555 字节
- 数据集总大小: 121418860 字节



