sanchit-gandhi/earnings22_split
收藏Hugging Face2022-09-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanchit-gandhi/earnings22_split
下载链接
链接失效反馈官方服务:
资源简介:
We partition the earnings22 dataset at https://huggingface.co/datasets/anton-l/earnings22_baseline_5_gram by `source_id`:
Validation: 4420696 4448760 4461799 4469836 4473238 4482110
Test: 4432298 4450488 4470290 4479741 4483338 4485244
Train: remainder
Official script for processing these splits will be released shortly.
我们将对托管于https://huggingface.co/datasets/anton-l/earnings22_baseline_5_gram的earnings22数据集,按照`source_id`(源ID)进行划分:
验证集:4420696、4448760、4461799、4469836、4473238、4482110
测试集:4432298、4450488、4470290、4479741、4483338、4485244
训练集:剩余样本
用于生成上述划分的官方脚本即将发布。
提供机构:
sanchit-gandhi
原始信息汇总
数据集概述
数据集名称
- 名称: earnings22
数据集来源
- 链接: https://huggingface.co/datasets/anton-l/earnings22_baseline_5_gram
数据集分割
- 验证集: 4420696, 4448760, 4461799, 4469836, 4473238, 4482110
- 测试集: 4432298, 4450488, 4470290, 4479741, 4483338, 4485244
- 训练集: 剩余部分
其他信息
- 处理脚本: 官方处理脚本即将发布。



