TNILab/squad_fl_top100
收藏Hugging Face2026-04-05 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/TNILab/squad_fl_top100
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: client_id
dtype: int64
- name: article_title
dtype: string
- name: context
dtype: string
- name: full_context
dtype: string
- name: question
dtype: string
- name: answers
list: string
- name: split
dtype: string
- name: context_token_length
dtype: int64
splits:
- name: train
num_bytes: 1645160645
num_examples: 27488
- name: test
num_bytes: 413919088
num_examples: 6918
download_size: 66211665
dataset_size: 2059079733
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征项:
- 客户端ID(client_id):数据类型为int64
- 文章标题(article_title):数据类型为字符串
- 上下文(context):数据类型为字符串
- 完整上下文(full_context):数据类型为字符串
- 问题(question):数据类型为字符串
- 答案列表(answers):数据类型为字符串列表
- 拆分集标识(split):数据类型为字符串
- 上下文Token长度(context_token_length):数据类型为int64
数据集拆分:
- 训练集(train):占用字节数1645160645,样本数量27488
- 测试集(test):占用字节数413919088,样本数量6918
下载总大小:66211665字节
数据集总存储大小:2059079733字节
配置项:
- 配置名称为default
数据文件:
- 拆分集train:对应路径data/train-*
- 拆分集test:对应路径data/test-*
提供机构:
TNILab



