RealTimeData/math_alltime
收藏Hugging Face2025-06-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RealTimeData/math_alltime
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置对应一个时间段(如2017-01到2020-03),每个配置包含问题、问题ID、得分、链接、正文、答案列表(包含答案ID、得分和文本)以及一个名为verbolised的字段。数据分割仅包含训练集,且每个配置的训练集都有对应的字节大小和示例数量。
This dataset contains multiple configurations, each corresponding to a time period (e.g., 2017-01 to 2020-03). Each configuration includes features such as question, question ID, score, link, body, a list of answers (containing answer ID, score, and text), and a field named verbolised. The data split only includes the training set, and each configurations training set has corresponding byte size and number of examples.
提供机构:
RealTimeData
原始信息汇总
数据集概述
该数据集包含多个配置,每个配置对应不同的时间段,从2017年1月至2020年3月。每个配置包含以下特征和分割信息:
特征
- question: 问题文本,数据类型为字符串。
- question_id: 问题ID,数据类型为64位整数。
- score: 问题得分,数据类型为64位整数。
- link: 问题链接,数据类型为字符串。
- body: 问题正文,数据类型为字符串。
- answers: 答案列表,包含以下子特征:
- answer_id: 答案ID,数据类型为64位整数。
- score: 答案得分,数据类型为64位整数。
- text: 答案文本,数据类型为字符串。
- verbolised: 数据类型为字符串。
分割信息
- train: 训练集分割,包含以下统计信息:
- num_bytes: 数据字节数。
- num_examples: 样本数量。
下载和数据集大小
- download_size: 下载大小,以字节为单位。
- dataset_size: 数据集大小,以字节为单位。
具体配置信息
以下是各配置的具体信息:
-
2017-01
- 训练集字节数: 80660853
- 样本数量: 941
- 下载大小: 9158732
- 数据集大小: 80660853
-
2017-02
- 训练集字节数: 84851628
- 样本数量: 910
- 下载大小: 10270205
- 数据集大小: 84851628
-
2017-03
- 训练集字节数: 65654141
- 样本数量: 873
- 下载大小: 8389188
- 数据集大小: 65654141
-
2017-04
- 训练集字节数: 69962303
- 样本数量: 900
- 下载大小: 8649741
- 数据集大小: 69962303
-
2017-05
- 训练集字节数: 61331035
- 样本数量: 850
- 下载大小: 7502347
- 数据集大小: 61331035
-
2017-06
- 训练集字节数: 69089197
- 样本数量: 857
- 下载大小: 8504218
- 数据集大小: 69089197
-
2017-07
- 训练集字节数: 65942734
- 样本数量: 833
- 下载大小: 7792388
- 数据集大小: 65942734
-
2017-08
- 训练集字节数: 68340459
- 样本数量: 842
- 下载大小: 8487447
- 数据集大小: 68340459
-
2017-09
- 训练集字节数: 61008346
- 样本数量: 896
- 下载大小: 7278417
- 数据集大小: 61008346
-
2017-10
- 训练集字节数: 53163267
- 样本数量: 818
- 下载大小: 6483992
- 数据集大小: 53163267
-
2017-11
- 训练集字节数: 59760183
- 样本数量: 808
- 下载大小: 7924709
- 数据集大小: 59760183
-
2017-12
- 训练集字节数: 55924348
- 样本数量: 836
- 下载大小: 6647153
- 数据集大小: 55924348
-
2018-01
- 训练集字节数: 53423968
- 样本数量: 804
- 下载大小: 6435279
- 数据集大小: 53423968
-
2018-02
- 训练集字节数: 56097587
- 样本数量: 836
- 下载大小: 6786404
- 数据集大小: 56097587
-
2018-03
- 训练集字节数: 52716955
- 样本数量: 811
- 下载大小: 6716783
- 数据集大小: 52716955
-
2018-04
- 训练集字节数: 61021658
- 样本数量: 834
- 下载大小: 7312214
- 数据集大小: 61021658
-
2018-05
- 训练集字节数: 55772617
- 样本数量: 786
- 下载大小: 7085239
- 数据集大小: 55772617
-
2018-06
- 训练集字节数: 51150298
- 样本数量: 749
- 下载大小: 6364046
- 数据集大小: 51150298
-
2018-07
- 训练集字节数: 54584695
- 样本数量: 758
- 下载大小: 6726781
- 数据集大小: 54584695
-
2018-08
- 训练集字节数: 55593417
- 样本数量: 781
- 下载大小: 6974572
- 数据集大小: 55593417
-
2018-09
- 训练集字节数: 54969100
- 样本数量: 823
- 下载大小: 6338898
- 数据集大小: 54969100
-
2018-10
- 训练集字节数: 61315262
- 样本数量: 760
- 下载大小: 6851372
- 数据集大小: 61315262
-
2018-11
- 训练集字节数: 60746966
- 样本数量: 716
- 下载大小: 6647704
- 数据集大小: 60746966
-
2018-12
- 训练集字节数: 66850978
- 样本数量: 743
- 下载大小: 8017159
- 数据集大小: 66850978
-
2019-01
- 训练集字节数: 66498129
- 样本数量: 757
- 下载大小: 7133679
- 数据集大小: 66498129
-
2019-02
- 训练集字节数: 62762617
- 样本数量: 727
- 下载大小: 7362944
- 数据集大小: 62762617
-
2019-03
- 训练集字节数: 53635552
- 样本数量: 722
- 下载大小: 6159124
- 数据集大小: 53635552
-
2019-04
- 训练集字节数: 55324827
- 样本数量: 711
- 下载大小: 6655057
- 数据集大小: 55324827
-
2019-05
- 训练集字节数: 56829578
- 样本数量: 723
- 下载大小: 6558721
- 数据集大小: 56829578
-
2019-06
- 训练集字节数: 61139555
- 样本数量: 688
- 下载大小: 7221420
- 数据集大小: 61139555
-
2019-07
- 训练集字节数: 53673145
- 样本数量: 683
- 下载大小: 6416744
- 数据集大小: 53673145
-
2019-08
- 训练集字节数: 77910351
- 样本数量: 747
- 下载大小: 9404169
- 数据集大小: 77910351
-
2019-09
- 训练集字节数: 63119202
- 样本数量: 745
- 下载大小: 7318462
- 数据集大小: 63119202
-
2019-10
- 训练集字节数: 49155709
- 样本数量: 683
- 下载大小: 5592949
- 数据集大小: 49155709
-
2019-11
- 训练集字节数: 48224122
- 样本数量: 709
- 下载大小: 5549457
- 数据集大小: 48224122
-
2019-12
- 训练集字节数: 55688069
- 样本数量: 710
- 下载大小: 6563642
- 数据集大小: 55688069
-
2020-01
- 训练集字节数: 53792398
- 样本数量: 683
- 下载大小: 6403117
- 数据集大小: 53792398
-
2020-02
- 训练集字节数: 46752243
- 样本数量: 683
- 下载大小: 5617224
- 数据集大小: 46752243
-
2020-03
- 训练集字节数: 44255484
- 样本数量: 683
- 下载大小: 5617224
- 数据集大小: 44255484



