regisss/scrolls_gov_report_preprocessed_mlperf
收藏Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/regisss/scrolls_gov_report_preprocessed_mlperf
下载链接
链接失效反馈官方服务:
资源简介:
预处理后的政府报告数据集,包含训练和验证数据,用于自然语言处理任务。数据集特征包括input_ids和labels,分别使用int32和int64序列类型。
预处理后的政府报告数据集,包含训练和验证数据,用于自然语言处理任务。数据集特征包括input_ids和labels,分别使用int32和int64序列类型。
提供机构:
regisss
原始信息汇总
数据集概述
配置信息
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 验证集: data/validation-*
数据集信息
- 特征:
- input_ids: 序列类型为int32
- labels: 序列类型为int64
- 分割:
- 训练集:
- 字节数: 550940448
- 样本数: 5604
- 验证集:
- 字节数: 23889816
- 样本数: 243
- 训练集:
- 下载大小: 111686734
- 数据集大小: 574830264



